[問題] pd.read_csv ParserError

作者: ctr1 (【積π】)   2019-10-23 22:03:19
df = pd.read_csv('test3.log', sep="\s+", header=None, prefix='COL')
文本分隔是以' '或大於一個空白切分
沒有header
但是當切到內容含有 // 時會報錯
ParserError: Error tokenizing data. C error: Expected 6 fields in line 2, saw
7
有查過使用error_bad_lines=False屬性 但想保留資料
想問問看是否有不需要replace整份文本而可以正常read_csv檔
因為csv檔又大又多,若是一行一行replace很耗時費力
感謝大大
作者: TitanEric (泰坦)   2019-10-23 22:36:00
這應該是因為你有多//所以導致attributes不一致 看你要先做前處理移掉還是你指定要7個attributes 空值填NaN
作者: ctr1 (【積π】)   2019-10-23 22:38:00
沒辦法read_csv->dataframe,是否只能一行一行的前處理呢
作者: TitanEric (泰坦)   2019-10-24 10:35:00
可以一行處理 就用python讀檔處理後再存新檔https://bit.ly/2pcmswm 剛做的 可以參考一下
作者: ctr1 (【積π】)   2019-10-24 14:50:00
謝謝你~

Links booklink

Contact Us: admin [ a t ] ucptt.com