PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] BeautifulSoup 新手問題
作者:
bluefantasia
(鏡華)
2018-03-14 11:56:01
各位前輩好,小弟
剛開始接觸Python,最近剛學到BeautifulSoup做爬蟲
於是就想要試著實做看看,但是看了老半天還是不是很了解
soup.get_text、soup.content等差別
還有bs4.element.Tag到底有那些指令是可以用的
目前小弟用yahoo的電影排行做練習,程式碼如下:
作者:
froce
(froce)
2018-03-14 16:00:00
http://beautifulsoup.readthedocs.io/zh_CN/latest/#id27
find_all()應該會是你要的
作者:
bluefantasia
(鏡華)
2018-03-14 16:13:00
感謝f大,但是我目前用上面程式碼跑的結果是如下:['2'] <div class="rank_txt">紅雀</div>前面的[2]用content提出來,但是後面名字卻提不出來find_all我看到可用加關鍵字,但是片名似乎無法?
作者:
froce
(froce)
2018-03-14 16:33:00
因為你的Title第1個會是None(bs4沒找到),當然不會有contcontents可以給你抓啊。
https://ideone.com/2K5hXn
你可以看我改過的範例
作者:
bluefantasia
(鏡華)
2018-03-14 16:58:00
f大的結果就是我想做出來的啊(泣)~但想請問一下if A and B一般是兩者成立,所以這邊是兩者都有找到才print出來的意思嗎?
作者:
froce
(froce)
2018-03-14 17:04:00
對,沒找到會傳回 None,None typeˉ當然不會有contents等屬性,你要程式印出 None.contents,我們可愛的蟒蛇當然會生氣氣的跟你說「你唬我喔」。所以要檢查傳回結果都不是 None,才能存取contents屬性。另外可以去學 pyquery,學會你也會用 CSS selector 了。
作者:
bluefantasia
(鏡華)
2018-03-15 04:51:00
收到,感謝f大的指點
繼續閱讀
[教學] python import xlwing 問題
gecer
[問題] CMD執行速度
bckkt
[問題] no module named、 cannt import name
letmeloveyou
[問題]算法 k distinct letters
suhang
Re: [問題] 跑Keras的model正常GPU使用率會是多少
pipidog
[問題] gurobi 最佳化 多重解問題
jasonfghx
[問題] Pycharm安裝library問題
HybridSC
[問題] 新手pycharm skimage一直裝不好
jerryhsieh30
[問題] Selenium xpath 讀取href的問題
zo6596001
[問題]PYTHON 新手請教,如何重複運行程式
xmsun
Links
booklink
Contact Us: admin [ a t ] ucptt.com