[問題] 網頁爬蟲多個class疑問 sgps50601 PTT批踢踢實業坊

[問題] 網頁爬蟲多個class疑問

作者: sgps50601 (é˜¿æ´‹) 2017-08-26 13:23:22

最近練習使用beautiful soup爬公司營收網頁，發現這個表格里有兩個class，一個是正數t3n1，另一個t3r1來區分負數，於是嘗試用find_all再加上("td",{"class":"t3n1","class":"t3r1"})來抓取，卻都只能抓到正數t3n1，還在思考是否少了什麼，想詢問一下高手的見解，以下檢附程式碼。
(網頁片段)
...
<td class="t3n0">102.3Q</td>
<td class="t3n1">162,577</td>
<td class="t3n1">83,636</td>
<td class="t3n1">78,941</td>
<td class="t3n1">48.56%</td>
<td class="t3n1">59,618</td>
<td class="t3n1">36.67%</td>
<td class="t3r1">-268</td>
<td class="t3n1">59,350</td>
<td class="t3n1">51,952</td>
...
(Python程式碼)
url = 'http://fund.bot.com.tw/Z/ZC/ZCE/ZCE_2330.DJHTM'
response = rq.get(url)
html_doc = response.text # text 屬性就是 html 檔案
soup = BeautifulSoup(response.text, "lxml") # 指定 lxml 作為解析器
revence_id =[] #營收單位
revence_date =[] #日期
revence_main =[] #金額
price =soup.find_all("td",{"class":"t3n1","class":"t3r1"})
print(price)

作者: wennie0433 2017-08-26 21:15:00

findAll('td', {'class':['t3n1','t3r1']})

作者: sgps50601 (é˜¿æ´‹) 2017-08-26 22:12:00

感謝wennie大，可以抓到正負了，看來用字典似乎抓不到。

繼續閱讀

[問題] 如何把讀wav檔並轉成向量？wallrose [問題] python 連 SQL serverf496328mm [問題] swapping elements of list in forloopdazmin [問題] 用keras模組時，要怎麼用cuda和cudnnssd860505da [問題] str轉換hiddenwind [問題] 關於重複搜尋paulluopaull [問題] python爬蟲抓取資料問題blue14753 Re: [問題] 排列組合只取一半XII [閒聊] 專案誠徵開發伙伴(非視覺資訊探究開發)TYHTW Re: [問題] 排列組合只取一半hutdris