[問題] Beautifulsoup的get_text()問題

作者: peace9527 (謝謝你9527)   2016-01-30 10:45:15
昨天用BeautifulSoup(BS)的get_text()成功抓取網頁資料
但是問題出現了
我抓的網站是簡體字網站
但是用get_text()抓出來的是像這樣的資料:
b'/x56/x34/x49/x04'
我查看了一下他的資料型態是bytes
網頁的編碼是UTF-8 我電腦的預設編碼也是UTF-8
我想把這個資料轉成用原本的簡體字顯示 請問有辦法嗎?
感謝各位大神的幫忙!
作者: ocean5566 (煙大屌熟男)   2016-01-30 17:47:00
decode
作者: peace9527 (謝謝你9527)   2016-01-30 21:42:00
不過他內容前面有個b 需要把他變成u再decode嗎?
作者: ccwang002 (亮)   2016-01-31 02:12:00
b'...' 表示是 bytes,就直接 decode 不用什麼 u

Links booklink

Contact Us: admin [ a t ] ucptt.com