[資訊] HTML解析庫 requests-html

作者: vi000246 (Vi)   2018-03-15 17:47:07
GithubL:https://github.com/kennethreitz/requests-html
文件:http://html.python-requests.org/
剛在github看到 覺得很實用就分享一下
這套件可以用來解析html
支援javascript render
不需要特地用selenium就能取得js渲染過的html
也支援複雜的CSS選擇器與xpath語法
還能自動翻頁,我不知道這怎麼實現的 還滿厲害的
之前都是用xpath搭配正規表達式硬幹
這套件看起來還滿方便的
作者: uranusjr (←這人是超級笨蛋)   2018-03-15 18:06:00
自動翻頁就是用猜的, 沒什麼魔法
作者: HenryLiKing (HenryLiKing)   2018-03-15 21:42:00
有支援JS有點猛欸 為什麼啊?!
作者: Sunal (SSSSSSSSSSSSSSSSSSSSSSS)   2018-03-15 23:00:00
用了pyppeteer 是Puppeteer的非官方py版本會下載安裝Chromium~~~
作者: gbllggi (gbllggi)   2018-03-15 23:57:00
推推

Links booklink

Contact Us: admin [ a t ] ucptt.com