[問題] python爬蟲問題 shot0512 PTT批踢踢實業坊

[問題] python爬蟲問題

作者: shot0512 (誠實豆沙包) 2020-07-23 17:45:44

小弟是爬蟲菜鳥新手
最近在學習如何爬蟲
從最基本的靜態網頁開始爬起
以下是我的CODE
import requests
from bs4 import BeautifulSoup
import time
url = "http://www.eslite.com/Search_BW.aspx?query=python&searchType=&page=1"
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser') #先輸入的是要解析的文件名稱後面是
parser
page = 1
all_titles=[]
def parse(html, page):
print(page)
all_td_tags = soup.find_all('td', class_="name")
for item in all_td_tags:
title=item.a.span.text.strip()
all_titles.append(title)
next_page_node = soup.find('a',
id="ctl00_ContentPlaceHolder1_pager1_next") #下一頁的node
print (next_page_node.get('href'))
print("

作者: TakiDog (多奇狗) 2020-07-23 18:37:00

你的request只產生了一次，parse一直執行同一個資料

作者: shot0512 (誠實豆沙包) 2020-07-23 19:24:00

next_html = requests.get(next_url).text但這裡不是已經有再去request了嗎？我知道發生什麼事了感謝大大

作者: a28503662 (Ok Rocker) 2020-08-12 13:05:00

應該要再給soup解析一次吧～

繼續閱讀

[問題] selenium問題shinle14 [問題] pyqt 滑鼠點擊事件創造按鈕 (已解決)znmkhxrw [問題] list與dict的混用cococrisp7 [問題] 關於絕對路徑。ides13 [問題] CKIPtagger 套件環境s878530 [問題] guizero/RPI 無法輸入中文HuangJC [問題] Matplotlibjason60602 [問題] 範圍當作dictionary keyrtt2008 [問題] json多層解析問題love11098787 [問題] dataframe 裡面作分類theusa