[問題] pd.read_csv ParserError ctr1 PTT批踢踢實業坊

[問題] pd.read_csv ParserError

作者: ctr1 (【積π】) 2019-10-23 22:03:19

df = pd.read_csv('test3.log', sep="\s+", header=None, prefix='COL')
文本分隔是以' '或大於一個空白切分
沒有header
但是當切到內容含有 // 時會報錯
ParserError: Error tokenizing data. C error: Expected 6 fields in line 2, saw
7
有查過使用error_bad_lines=False屬性但想保留資料
想問問看是否有不需要replace整份文本而可以正常read_csv檔
因為csv檔又大又多，若是一行一行replace很耗時費力
感謝大大

作者: TitanEric (泰坦) 2019-10-23 22:36:00

這應該是因為你有多//所以導致attributes不一致看你要先做前處理移掉還是你指定要7個attributes 空值填NaN

作者: ctr1 (【積π】) 2019-10-23 22:38:00

沒辦法read_csv->dataframe，是否只能一行一行的前處理呢

作者: TitanEric (泰坦) 2019-10-24 10:35:00

可以一行處理就用python讀檔處理後再存新檔https://bit.ly/2pcmswm 剛做的可以參考一下

作者: ctr1 (【積π】) 2019-10-24 14:50:00

謝謝你~

繼續閱讀

[問題] 將XML進行縮排qazwsx99876 [問題] 可以連到資料庫下語法並取出結果嗎qazwsx99876 [問題] 如何將資料放入tensor中j23793276 [問題] 有人有上過勞動補助的AI課程嗎?prott [問題] 如何較快從key,value list建立 dict listthanksgive [問題] pynput trigger enter 方法kiey [問題] 直接print出來顯示變亂碼qazwsx99876 [問題] 使用popen是否可以傳遞實例？Dong0129 [問題] 請問matplotlib畫圖問題nicha115 [問題] pip壞掉了怎麼辦sooge