PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Web_Design
[問題] 爬動態資料問題
作者:
zcxcxc20002
(凌晨是我)
2015-03-02 14:30:25
各位大大大家好,
爬網頁資料很常被用來做一些資料搜集或整理上,
以前不管是使用DOM的比對或者是Regex來處理都還好處理,
但自從很多網頁開始使用動態載入資料之後,原本的做法變得不可行。
不知道版有大大有沒有相關資訊可以用來解決這樣的問題?
是否要透過不一樣的技術來搜集資料。?
作者:
mmis1000
(秋月戀楓)
2015-03-02 15:52:00
phantom js要不然就自己解出ajax的網站模擬request現在瀏覽器的開發者工具都有看request的功能
作者: guanting886 (Guanting)
2015-03-02 22:37:00
phantom +1,不過早期都是用C#+WebBrowser硬幹
作者:
tom76kimo
2015-03-03 00:09:00
試試
https://github.com/tom76kimo/RoadMap-JS
>//<
作者:
zcxcxc20002
(凌晨是我)
2015-03-03 11:33:00
謝謝各位大大提供,我也都用C#抓比較多
作者:
slamgundam
(Rick)
2015-03-04 09:36:00
想問phantomjs可以操作linux換IP嗎~?
作者:
mmis1000
(秋月戀楓)
2015-03-04 12:14:00
你可以把他跟其他語言合用?像是nodejs就有phantom的bridge,phantom js本身也能單獨拿來當server用phantom js本身應該沒那些功能
作者:
slamgundam
(Rick)
2015-03-04 14:02:00
Ok,我再研究看看,感謝你~
作者:
best940070
(Kevin)
2015-03-20 23:03:00
寫瀏覽器套件去抓
繼續閱讀
[問題] checkbox
ZCBVXIRD
[問題] javascript 變數代入getElementById?
tony5566
[心得] 面試心得
superpai
[請益] 協助提供NGO網站規劃書建議
pzman
[問題] ASP.NET排版不如預期的問題
aoksc
[問題] inline-block排版問題
wkidso
[問題] 排版的問題
PowerKid
[請益] PDFLib
jerry123789
[問題] MVC中,維持data consistent的責任在誰?
Kenqr
[問題] Bootstrap ->IE8 爆CPU
Notte
Links
booklink
Contact Us: admin [ a t ] ucptt.com