[問題] 爬蟲偽元素問題

作者: ks110159 (HFDragon)   2018-05-23 15:02:49
小弟最近在練習簡單的爬蟲
使用bs抓取資料
但每每遇到 ::before ::after 之間的資料
像抓取以下中國時報的新聞標題 都無法順利抓取
https://i.imgur.com/mnC6a0p.jpg
爬了一下文發現是非html的部分
想請問有什麼方法可以解決這種js的問題
作者: tlaceruse   2018-05-23 16:40:00
關鍵找 js 怎麼吃資料進來的。如果真的找不到 那就直接模擬開啟瀏覽器選元素 一般都選得到 但吃資源問題
作者: ks110159 (HFDragon)   2018-05-23 17:50:00
請問t大 模擬瀏覽器選元素是使用selenium嗎
作者: HybridSC (VisionS)   2018-05-25 02:25:00
selenium
作者: ks110159 (HFDragon)   2018-05-25 09:06:00
謝謝h大

Links booklink

Contact Us: admin [ a t ] ucptt.com