[問題] 使用 Python 爬蟲但一直會抓到重複的文字

作者: perfectkevin (No)   2025-04-20 16:39:59
請問各位
我使用以下的 code 想要爬一篇多頁面的Review網站文字
結果是可以爬出來,但每一頁的文字都會被重複爬取2~3次
造成最後爬出來的結果文字數量是超級爆炸多
想請問我的code 是哪邊有問題?
謝謝各位
code分享連結:
https://ideone.com/493g7j
爬取頁面:
https://reurl.cc/7K01b9
Note:
code裡面的 URL 我是使用動態產生的網址變數 "initial_url"
作者: shadowjohn (轉角遇到愛)   2025-04-20 18:38:00
你可能要限制只抓 div class='entry' 裡的所有 p

Links booklink

Contact Us: admin [ a t ] ucptt.com