[問題] requests.get中文網址出現 BadStatusLine tides PTT批踢踢實業坊

[問題] requests.get中文網址出現 BadStatusLine

作者: tides (monet) 2019-01-27 21:03:36

新人剛接觸 Crawler
想要爬中文網址的 url
(e.g. https://dictionary.cambridge.org/zht/詞典/英語-漢語-繁體/tuple)
使用下面的方式處理 UTF-5
但會碰到 http.client.BadStatusLine 的問題
不知道有什麼可能的解決方向？
底下是示範碼:
import requests
# import sys
from safeprint import print
import urllib
url1 = "https://dictionary.cambridge.org/zht/詞典/英語-漢語-繁體/tuple"
url5 = "https://dictionary.cambridge.org/zht/%E8%A9%9E%E5%85%B8/%E8%8B%B1%E8%AA%9E-%E6%BC%A2%E8%AA%9E-%E7%B9%81%E9%AB%94/tuple"
url6a = "https://dictionary.cambridge.org/zht/"
url6b = urllib.parse.quote("詞典/英語-漢語-繁體")
url6c = "/tuple"
url6 = url6a + url6b + url6c # url6 = url5
print(url6)
print(url5)
r = requests.get(url5) # get error here
r.encoding='utf-8'
print(r.text)

作者: nini200 (200妮妮) 2019-01-31 05:51:00

這網站你要的是什麼??

繼續閱讀

[問題] Python Selenium抓國旅卡網站資訊亂碼threeSecGun [問題] 如何避免執行遇錯時console視窗閃退？shala [心得] 用selenium爬網頁時.click()失效的解法utap2001 [問題] heroku收費方式vi000246 [問題] Python 抓鉅亨網台股歷史資料日期問題xyz66217 Re: [問題] 用c#當UI，python當後端MasterChang [問題] 用c#當UI，python當後端ponwar87123 [問題] Pycharm 中使用Anaconda的問題metsuan [問題]某資料夾下某特定副檔名的檔案數計算yimean [問題] 關於Django一些問題firstlovesky