大家好
我現場有大概2000份檔案,每個都要用pandas去讀
可是有個問題是這些檔案的columns數量可能不太一樣
比方說有的檔案有8個columns,但有的卻有10個
我現在希望每個檔案的column名稱都以那10個columns的為主
而如果當下讀的檔案是屬於8個columns的那種,那多出來的那兩個columns裡面的資料就
都用NaN呈現即可
直接設df.columns = [我希望的那10個columns]
這樣顯然不行
有想到讀檔時就用names參數設定,不過手邊沒有電腦還沒試過這樣可不可以
請問這樣的話要怎麼做呢?
謝謝!