PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
PHP
[請益] 如果我想要手動抓下一個網站要如何開始?
作者:
oiolong
(龍龍龍)
2017-07-13 10:08:11
請問一下
我想要把一個網站裡面的所有資訊拿下來到資料庫裡面
我要怎麼開始呢?
google 過有很多 github 的 source code
但由於是初學者,想要自己造輪子
我的構思大概是這樣
1 用 curl 去拿到 sourcecode
2 用 php 去分析內容 (regular expression or xpath or .... ?)
3 存入db
目前卡在2 的選型上面,
想請教版上的大大們
哪種方式比較好呢?
作者:
MOONRAKER
(㊣牛鶴鰻毛人)
2017-07-13 10:30:00
以2而言,弄一個HTML parser應該比較方便
作者:
shadowjohn
(轉角遇到愛)
2017-07-13 11:04:00
2 有 simplehtmldom、phpquery 可以用,re稍累簡單的用getBetween就好了,php manual滿多人分享
繼續閱讀
[請益] 請問有人使用過問卷系統LimeSurvey嗎
Ohgogogo
[請益] 繼承的練習 跑不出來
james733s
[請益] 正規表達式能使用變數嗎?
q10242
[請益] 參數物件的使用
DongFeng
[請益] mac xampp Xampp-vm 用途
chiang0514
[請益] 如何呼叫另一個程式
davidroman
Re: [請益] line Messaging API 開發
lovemba
Re: [閒聊] 新手學 PHP 不要從 Laravel 開始
Neisseria
Re: [閒聊] 新手學 PHP 不要從 Laravel 開始
JYHuang
[閒聊] 新手學 PHP 不要從 Laravel 開始
GALINE
Links
booklink
Contact Us: admin [ a t ] ucptt.com