PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] 為何中文字串用UTF-8存檔後變成亂碼?
作者:
shala
(沙羅)
2019-01-16 14:15:04
我從某網站01頁、02頁...這樣掃出想要的字串,並用UTF-8存為純文字檔
但有某頁的中文字串存檔後都變成亂碼
亂碼類似這種感覺:%#[email protected]
(正確而言不是這樣的符號,很多是PTT無法顯示的字元)
非中文的字串都正確存檔,所以應該是編碼錯誤
但其他頁的執行結果都正確,唯獨某頁會這樣
觀察該頁原始碼還是沒發現除了文字內容之外和其他頁不一樣的地方
有人遇過這種問題嗎?
是不是因為遇到什麼特殊字元?
作者:
jiyu520
(不要鯽魚我)
2019-01-16 15:42:00
亂碼有可能是你檢視時的問題;可以附上連結或圖嗎?
作者:
sherees
(ShaunTheSheep)
2019-01-16 16:11:00
encoding='utf-8-sig'
作者:
s860134
(s860134)
2019-01-16 21:43:00
直接給有問題的頁面和你爬的 code,窮舉亂槍打鳥很難站內信 或是給個頁面原始碼...你看一下網頁原始碼 <meta charset="xxxx" />big5 要用 big5 解,utf8要用 utf8 解把資料餵給 bs 去爬的時候是 bytes,先 decode成 unicode在餵進去
繼續閱讀
[問題] 新手發問
chenbigdog
Re: [問題] 有點迷惘於python的世界
arsl400
[問題] pyautogui 遊戲外掛
oiulkj
[問題] matplotlib該如何畫出類似這樣的圖呢
wayne64001
[問題] python前端串接與scrapy翻頁
peco36
[問題] LC 505 the maze ii
sean72
[問題] 初學python疑問(已解決
yeah66666
[問題] 旋轉座標
irisowo
Re: [問題] 有點迷惘於python的世界
yimean
[問題] 有點迷惘於python的世界
asd2213857
Links
booklink
Contact Us: admin [ a t ] ucptt.com