[問題] 如何取得標籤內的值

作者: code0093 (DADY)   2020-12-11 15:50:51
寫了一個程式,但不知道怎麼抓到標籤裡面的值,都會連同標籤一同打印。
如圖,我想要取得去掉<b>後的值
https://i.imgur.com/lzRSiCo.jpg
請各位大大指點
作者: LP9527 (ㄊㄇ抽菸都去)   2020-12-11 16:53:00
bs4 的text 或 string 研究一下不然你就轉str自己replace
作者: code0093 (DADY)   2020-12-11 17:09:00
成功了,我用string 跟text都抓的到。感謝
作者: aidansky0989 (alta)   2020-12-12 08:54:00
別用美麗湯,效能差語法糖也沒多好吃
作者: james732 (好人超)   2020-12-12 17:15:00
目前有什麼可以取代bs4的好選擇嗎?
作者: aidansky0989 (alta)   2020-12-12 19:56:00
一般來說用xpath來提起html字串,再用re做細部處理,xpath是用c寫的效能比較好效能來說是re>xpath>bs4,如果你用scrapy從response.xpath
作者: ToastBen (吐司邊)   2020-12-12 22:16:00

Links booklink

Contact Us: admin [ a t ] ucptt.com