PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] 使用 Python 爬蟲但一直會抓到重複的文字
作者:
perfectkevin
(No)
2025-04-20 16:39:59
請問各位
我使用以下的 code 想要爬一篇多頁面的Review網站文字
結果是可以爬出來,但每一頁的文字都會被重複爬取2~3次
造成最後爬出來的結果文字數量是超級爆炸多
想請問我的code 是哪邊有問題?
謝謝各位
code分享連結:
https://ideone.com/493g7j
爬取頁面:
https://reurl.cc/7K01b9
Note:
code裡面的 URL 我是使用動態產生的網址變數 "initial_url"
作者:
shadowjohn
(轉角遇到愛)
2025-04-20 18:38:00
你可能要限制只抓 div class='entry' 裡的所有 p
繼續閱讀
[問題] 用Whisper AI幫我下載字幕(有酬)
iael
[問題] selenium 有辦法做檔案上傳嗎?
oskens
Fw: [討論] 哈囉 請問有給python新手的課程嗎
malnor
[問題] excel填入資料問題
qaz950270
Re: [問題] @property 真正的運用是啥
ddavid
[問題] class type 跟 class object
littrabble
[閒聊] python平行處理效能是否很差?
lovepork
[問題] @property 真正的運用是啥
littrabble
[閒聊] 有人要合購股票pythony資料庫finlab嗎?
tamacugi
[問題] 在IIS下使用呼叫EXE權限問題
akito117
Links
booklink
Contact Us: admin [ a t ] ucptt.com