[請益] 多網頁parse

作者: woominin (沒事就好)   2014-10-02 17:37:10
不好意思,又要請教有關於parse的問題
想請問 在parse完後
我得到了
名稱 + 網址
名稱 + 網址
名稱 + 網址
這樣很多個網址
要怎麼去把這一堆網址再丟去 第二層做multi url parse呢 ??
看simple dom 的範例都是單獨一個網址
// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');
那像我上面那樣 第一次parse後,一堆網址怎麼再去塞第二次再爬蟲呢
總不能手動一筆一筆丟吧 XDDDDDDDDDDDDDDDD
不好意思,請前輩們解惑
作者: hit1205 (幫你把勇氣裝滿)   2014-10-02 21:16:00
為什麼要手動呢 XD? 用 foreach 一個個丟?
作者: KawasumiMai (さあ、死ぬがいい)   2014-10-03 14:42:00
遞迴記得設定深度,還有重複判斷,否則沒完沒了通常這種應該是深度優先,廣度優先很佔記憶體

Links booklink

Contact Us: admin [ a t ] ucptt.com