作者:
imimi (im)
2016-08-30 22:03:44想請教各位高手
我有個input.txt 我很確定他是用utf-8儲存的
但是用以下的beautiful soup 處理 strip tag
卻還是亂碼 想請問是不是哪裡寫錯了 謝謝
import requests
from bs4 import BeautifulSoup
res = requests.get('http://localhost/input.txt',verify=False)
obj=bytes(res.text, "utf-8")
UTF8str=obj.decode('utf-8', 'ignore')
soup = BeautifulSoup(UTF8str, "html.parser")
text = soup.getText()
print(text)
但是出來 還是亂碼
我是照著書打的 實在不知道問題出在哪
感謝各位高手 ....orz