處理文本

作者: dinoptt1993 (dinoptt1993)   2016-11-20 15:37:04
小的在進行dcard爬蟲之後
要進行將超連結去除的處理
那以下是我的程式碼
附上原始文本
那結果感覺是亂碼!?
跪求 還有什麼辦法能解決呢?
感激不盡
http://i.imgur.com/g9s1MYS.jpg
作者: s860134 (s860134)   2016-11-20 15:49:00
編碼取得資料後確定它編碼是甚麼,看 idle 應該是decode錯了
作者: dinoptt1993 (dinoptt1993)   2016-11-20 23:53:00
http://i.imgur.com/OWyrDL6.jpg我另外寫了code但是這次可以成功將結果打印在shell上但是卻無法寫入檔案...結果好了 但是花了點時間!ㄡㄡ
作者: enjoyloli (M)   2016-11-21 12:54:00
要不要參考這篇 https://goo.gl/WRlRW0 講 unicode 的
作者: uranusjr (←這人是超級笨蛋)   2016-11-21 13:34:00
上面這篇是上個月寫的竟然用八年前發行的 Python 2.5 我也是很佩服
作者: s860134 (s860134)   2016-11-21 19:59:00
你幹嘛這樣xd

Links booklink

Contact Us: admin [ a t ] ucptt.com