pandas讀檔的問題 iphone2003 PTT批踢踢實業坊

pandas讀檔的問題

作者: iphone2003 (307) 2018-05-21 14:21:55

大家好
我現場有大概2000份檔案，每個都要用pandas去讀
可是有個問題是這些檔案的columns數量可能不太一樣
比方說有的檔案有8個columns，但有的卻有10個
我現在希望每個檔案的column名稱都以那10個columns的為主
而如果當下讀的檔案是屬於8個columns的那種，那多出來的那兩個columns裡面的資料就
都用NaN呈現即可
直接設df.columns = [我希望的那10個columns]
這樣顯然不行
有想到讀檔時就用names參數設定，不過手邊沒有電腦還沒試過這樣可不可以
請問這樣的話要怎麼做呢？
謝謝！

作者: eri820503 (snoopyahoo) 2018-05-21 14:53:00

pd.concat([df1,df2]) df1是舊的 df2是要加入的

作者: iphone2003 (307) 2018-05-22 20:19:00

研究了一下似乎真的只能先建好df後再併了...謝謝！

作者: clsmbstu 2018-05-24 18:54:00

這2000份檔案是想存成2000個df還是一個大df啊？感覺做法會不同 @@

繼續閱讀

[問題] PySide2安裝alfredisabug [問題] 爬蟲問題MAGICXX [問題] 比map_async快速省時的方法shaly0815 Re: [問題] Linux環境詢問pip3 套件安裝管理問題Neisseria [問題] Linux環境詢問pip3 套件安裝管理問題x246libra Re: [閒聊] pipenv dramaeight0 [徵求] Python家教~ 三重大安lay911225 [閒聊] pipenv dramaabc2090614 [問題]關於 string formattingccydt [問題] tensorflow的純計算怎麼那麼慢？king00000000