[問題] 卦板用request取得之原始碼不合

作者: DaKyu (丹明)   2018-01-26 17:28:50
大家好,
我目前剛開始藉Su Billy大大的簡單爬蟲教學video初學python爬蟲
遇到有個小問題,
就是我用request抓卦板的原始碼時
-
res = request.get('https://www.ptt.cc/bbs/Gossiping/index.html')
print(res.text)
-
印出的原始碼跟實際卦板網頁的原始碼對不上,
而是顯示像是PTT入口頁面的內容 如下圖
https://imgur.com/gmTQFY9
BUT!
我用Salary, Tech_job跟表特等其他板測試, 卻都沒有問題@@
想請問卦板的內容有何特殊之處嗎?
我對前端的html和CSS等語言完全不熟, 只學過基礎的python
望大家指教,謝謝板友Orz
作者: uranusjr (←這人是超級笨蛋)   2018-01-26 17:31:00
Session 問題, 你 request 裡面沒按過那個 18 禁按鈕
作者: leo850611 (Victorique)   2018-01-27 17:14:00
貌似模擬Google爬蟲可繞過那個按鈕
作者: penut85420 (PenutGGorz)   2018-01-29 14:25:00
可以用Selenium去點那個按鈕
作者: galeondx   2018-03-06 04:36:00

Links booklink

Contact Us: admin [ a t ] ucptt.com