Re: 這段哪裡錯 oz5566 PTT批踢踢實業坊

Re: 這段哪裡錯

作者: oz5566 (阿康) 2018-12-27 14:38:28

※ 引述《oz5566 (夏洛克。福爾摩斯)》之銘言：
: import requests
: from bs4 import BeautifulSoup
: url =
: 'http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9='
: res = requests.get(url)
: res.encoding = 'big5'
: soup = BeautifulSoup(res.text,'html.parser')
: articles = soup.select(tag_name)
: for n in range(1, 20):
: next_url =
: 'http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9='
: + str(n)
: url = next_url
: for art in articles:
: print(url)
: 東西會變成這樣
: 重複輸出
: http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9=2
: 20變才換數字
: 但把這段砍掉又正常了
: for art in articles:
: 這是為啥衝突?
我抓取第一頁是這樣
import requests
from bs4 import BeautifulSoup
url =
'http://www.tmica.org.tw/go/3796?time=16:42:28&q1=tolv&q65=2038999&qctrl=2038999&q106=3796&q9=1'
res = requests.get(url)
res.encoding = 'big5'
soup = BeautifulSoup(res.text,'html.parser')
tag_name = 'td a'
articles = soup.select(tag_name)
for art in articles:
print(art.text,art['href'])
輸出的東西沒問題
全部顯示
/go/3796?time=14:35:45&q1=tolv&qctrl=2038999&q65=2038999&q65=2038999&q106=3796
日生堂企業股有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181109095521
醫鎧股份有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181109100011
厚都企業有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181119145645
明惠貿易股份有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181119150113
宇岦健康事業有限公司
/go/3796?time=14:35:45&qctrl=2038999&q65=2038999&q106=3796&q1=viw&q100=20181119150955
然後我想說照著教學抓下一頁
就爆炸了
所以我也不知道ART 是啥

作者: durantjosh (肚爛特‧喬許) 2018-12-27 14:42:00

你是要輸出什麼

作者: emptie ([ ]) 2018-12-27 14:42:00

你要把整段包在迴圈裡面

作者: oz5566 (阿康) 2018-12-27 14:42:00

我現在練習輸出標題跟連結之後要輸出內文

作者: durantjosh (肚爛特‧喬許) 2018-12-27 14:43:00

所以你是要輸出下一頁的標題和連結？

作者: surimodo (好吃棉花糖) 2018-12-27 14:44:00

所以是要輸出下一頁會出錯?

作者: durantjosh (肚爛特‧喬許) 2018-12-27 14:44:00

這樣你next_url（下一頁的網址）也要送出request啊你原本的寫法，articles一直都是第一頁的東西

作者: oz5566 (阿康) 2018-12-27 14:47:00

所以?島八我聽鋪統QQ

作者: emptie ([ ]) 2018-12-27 14:47:00

把第一行的url 最後一個1 去掉，後面+str(n)然後把所有東西包在 for n in range(1,20)的迴圈裡面

作者: oz5566 (阿康) 2018-12-27 14:50:00

我44

繼續閱讀

Re: [母豬] 等等開泳裝貓劍david7928 Re: 現在皇城可以讓我調皮的空間TsushimaRiko [姆咪] LOL板回來了tLuesuGi [閒聊] 福島leopika [母豬] 等等開泳裝貓劍yulis 這段哪裡錯oz5566 哇靠竟然......CavendishJr 謝謝茄子yulis [姆咪] 働！百度網盤竟然......leegiway 名偵探果汁特別篇CavendishJr