[問題] python爬蟲問題

作者: shot0512 (誠實豆沙包)   2020-07-23 17:45:44
小弟是爬蟲菜鳥新手
最近在學習如何爬蟲
從最基本的靜態網頁開始爬起
以下是我的CODE
import requests
from bs4 import BeautifulSoup
import time
url = "http://www.eslite.com/Search_BW.aspx?query=python&searchType=&page=1"
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser') #先輸入的是要解析的文件名稱 後面是
parser
page = 1
all_titles=[]
def parse(html, page):
print(page)
all_td_tags = soup.find_all('td', class_="name")
for item in all_td_tags:
title=item.a.span.text.strip()
all_titles.append(title)
next_page_node = soup.find('a',
id="ctl00_ContentPlaceHolder1_pager1_next") #下一頁的node
print (next_page_node.get('href'))
print("
作者: TakiDog (多奇狗)   2020-07-23 18:37:00
你的request只產生了一次,parse一直執行同一個資料
作者: shot0512 (誠實豆沙包)   2020-07-23 19:24:00
next_html = requests.get(next_url).text但這裡不是已經有再去request了嗎?我知道發生什麼事了 感謝大大
作者: a28503662 (Ok Rocker)   2020-08-12 13:05:00
應該要再給soup解析一次吧~

Links booklink

Contact Us: admin [ a t ] ucptt.com