最近在自學網路爬蟲,一開始用BeautifulSoup
抓一些簡單的靜態網頁沒有問題,抓下來一大串html
我可以用re去解開來一個一個看
但對於需要更進階操作的網站,就顯得有些吃力
我知道可以進一步去學習Selenium或Scrapy
但在那之前,我想先學習一些網站的基本原理
市面上的書通常只會教傻瓜式的架站
我想了解的是,我打開瀏覽器,F12開後台
Network頁面裡面的各種機制
像是瀏覽器式怎麼知道要怎麼下request
網站response的格式是從哪邊取得,怎麼知道要怎麼解
請問有推薦的詳細教學網站或書籍嗎?
感謝