[問題] 爬蟲遇到一樣的class如何篩選

作者: skyivan (官人)   2017-08-31 16:31:03
各位好,我看書試著依樣畫葫蘆抓台彩首頁的開獎號碼
抓威力彩可以,但想抓大樂透時遇到問題
仔細一看發現有好幾種商品的class都是contents_box02,用find只能得到第一個
只抓得到威力彩
用find_all可以同時找到好幾個商品
但不知道如何只抓第三個class為contents_box02的div
想請教如何處理,程式碼如下
import requests
from bs4 import BeautifulSoup
url="http://www.taiwanlottery.com.tw"
html=requests.get(url)
sp=BeautifulSoup(html.text, 'html.parser') #解析原始碼
data1=sp.find_all('div',{'class':'contents_box02'})
print(data1)
作者: blue14753 (blue14753)   2017-08-31 16:41:00
print(data1[2]) ?
作者: wennie0433   2017-08-31 22:14:00
換個html5lib or lxml 解析看看
作者: coeric ( )   2017-09-01 11:02:00
print(data1[2]) 即可
作者: skyivan (官人)   2017-09-01 11:22:00
原來這麼簡單...問題解決了,感謝樓上幾位的回答

Links booklink

Contact Us: admin [ a t ] ucptt.com