求救版上的高手,小弟我又卡關了,
最近在做df的轉換,將爬蟲程式抓的CSV轉換成我要的格式,
可是卻遇到錯誤:Index contains duplicate entries, cannot reshape
我個人認為會出錯是當初網頁的資料問題,如連結:
http://webdata.bird.org.tw/contents.php?key=80002
從80002到80007的藍色欄位資料都是一樣的,所以我再用DF轉換的時候,
無法以欄位做分割每個獨立網頁資料
這有辦法解決嗎? 還是我需要做資料的比對?
scrapy抓下的資料CSV檔:
https://drive.google.com/open?id=0B6SUWnrBmDwSazZzRHN0UjkxaVE&authuser=0
code:
https://drive.google.com/open?id=0B6SUWnrBmDwSSVNjQnpwS0dqUUk&authuser=0
勞煩各位高手幫小弟的忙