[問題] BeautifulSoup 新手問題

作者: bluefantasia (鏡華)   2018-03-14 11:56:01
各位前輩好,小弟
剛開始接觸Python,最近剛學到BeautifulSoup做爬蟲
於是就想要試著實做看看,但是看了老半天還是不是很了解
soup.get_text、soup.content等差別
還有bs4.element.Tag到底有那些指令是可以用的
目前小弟用yahoo的電影排行做練習,程式碼如下:
作者: froce (froce)   2018-03-14 16:00:00
作者: bluefantasia (鏡華)   2018-03-14 16:13:00
感謝f大,但是我目前用上面程式碼跑的結果是如下:['2'] <div class="rank_txt">紅雀</div>前面的[2]用content提出來,但是後面名字卻提不出來find_all我看到可用加關鍵字,但是片名似乎無法?
作者: froce (froce)   2018-03-14 16:33:00
因為你的Title第1個會是None(bs4沒找到),當然不會有contcontents可以給你抓啊。https://ideone.com/2K5hXn你可以看我改過的範例
作者: bluefantasia (鏡華)   2018-03-14 16:58:00
f大的結果就是我想做出來的啊(泣)~但想請問一下if A and B一般是兩者成立,所以這邊是兩者都有找到才print出來的意思嗎?
作者: froce (froce)   2018-03-14 17:04:00
對,沒找到會傳回 None,None typeˉ當然不會有contents等屬性,你要程式印出 None.contents,我們可愛的蟒蛇當然會生氣氣的跟你說「你唬我喔」。所以要檢查傳回結果都不是 None,才能存取contents屬性。另外可以去學 pyquery,學會你也會用 CSS selector 了。
作者: bluefantasia (鏡華)   2018-03-15 04:51:00
收到,感謝f大的指點

Links booklink

Contact Us: admin [ a t ] ucptt.com