Re: 這段哪裡錯

作者: oz5566 (阿康)   2018-12-27 14:38:28
※ 引述《oz5566 (夏洛克。福爾摩斯)》之銘言:
: import requests
: from bs4 import BeautifulSoup
: url =
: 'http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9='
: res = requests.get(url)
: res.encoding = 'big5'
: soup = BeautifulSoup(res.text,'html.parser')
: articles = soup.select(tag_name)
: for n in range(1, 20):
: next_url =
: 'http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9='
: + str(n)
: url = next_url
: for art in articles:
: print(url)
: 東西會變成這樣
: 重複輸出
: http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9=2
: 20變 才換數字
: 但把這段砍掉 又正常了
: for art in articles:
: 這是為啥 衝突?
我抓取第一頁是這樣
import requests
from bs4 import BeautifulSoup
url =
'http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9=1'
res = requests.get(url)
res.encoding = 'big5'
soup = BeautifulSoup(res.text,'html.parser')
tag_name = 'td a'
articles = soup.select(tag_name)
for art in articles:
print(art.text,art['href'])
輸出的東西沒問題
全部顯示
/go/3796?time=14:35:45&q1=tolv&qctrl=2038999&q65=2038999&q65=2038999&q106=3796
日生堂企業股有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181109095521
醫鎧股份有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181109100011
厚都企業有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181119145645
明惠貿易股份有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181119150113
宇岦健康事業有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181119150955
然後我想說照著教學抓下一頁
就爆炸了
所以我也不知道ART 是啥
作者: durantjosh (肚爛特‧喬許)   2018-12-27 14:42:00
你是要輸出什麼
作者: emptie ([ ])   2018-12-27 14:42:00
你要把整段包在迴圈裡面
作者: oz5566 (阿康)   2018-12-27 14:42:00
我現在練習輸出標題跟連結 之後要輸出內文
作者: durantjosh (肚爛特‧喬許)   2018-12-27 14:43:00
所以你是要輸出下一頁的標題和連結?
作者: surimodo (好吃棉花糖)   2018-12-27 14:44:00
所以是要輸出下一頁會出錯?
作者: durantjosh (肚爛特‧喬許)   2018-12-27 14:44:00
這樣你next_url(下一頁的網址)也要送出request啊你原本的寫法,articles一直都是第一頁的東西
作者: oz5566 (阿康)   2018-12-27 14:47:00
所以?島八 我聽鋪統QQ
作者: emptie ([ ])   2018-12-27 14:47:00
把第一行的url 最後一個1 去掉,後面+str(n)然後把所有 東西 包在 for n in range(1,20)的迴圈裡面
作者: oz5566 (阿康)   2018-12-27 14:50:00
我44

Links booklink

Contact Us: admin [ a t ] ucptt.com