大家好,最近在學習Python的網路爬蟲時,常常遇到
1.先備知識不足的情況,可能花非常多的時間在爬文
2.網路初階課程完整且實用,但深入的話,不清楚需要多深入,才能解決現有問題
,常常迷失在各種專用術語之中,不知該如何學起
請問,有沒有甚麼大原則或方法,能夠在學習的階段中,自我評估出
,需要達成目標所必要的基本知識,來減少盲目爬文的時間呢?
謝謝
補充實際例子 : 在學習網路爬蟲時,想爬一個網站,用request,但是當爬取資料被拒絕
[403 forbidden],在繼續爬文時,發現應該是headers的問題,但是headers又要去
http header的介紹網站學習,當相關的資料看不懂時,就只好換一個
http header的介紹網站學習