PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] Beautifulsoup的問題
作者:
kanako
(我是香民)
2014-03-10 11:04:28
我在解析網頁時遇到某個欄位tag的層數不固定
可能的例子:
1.<div>範例</div>
2.<div><div>範例</div></div>
3.<div><div><p>範例</p></div></div>
想請問一下我要如何處理以上三種狀況,才能正確取出範例這兩個字?
只能用regular expression嗎?
謝謝
作者:
jokester
(蠻王科科)
2014-03-10 12:09:00
可以po一下代碼嗎? 我用BeautifulSoup.getText()就拿到
作者: qwertmn (抽筋)
2014-03-11 01:45:00
In [1]: from bs4 import BeautifulSoupIn [2]: body = BeautifulSoup('<div><div><p>範例</p></dIn [3]: body.text這樣抓不到媽?
繼續閱讀
[問題] ipython notebook 執行順序?
kusoayan
Re: [閒聊] 魏老師的挑戰狀2
weijr
Fw: [請益] 我的需求用python是否適合?
orangeforest
[問題] tempelate與tempelatetags
IDanceAlong
[閒聊] 魏老師的挑戰狀2
changyuheng
[閒聊] 在 M$ 環境下讀檔
apua
Re: [問題] 字串處理 - 簡化程式碼
pycontw
[問題] 有沒有人寫過python平行處理
tonykai
Re: [問題] 字串處理 - 簡化程式碼
auoauo
Re: [問題] 網路上有關於資料結構使用Python的教學
Neisseria
Links
booklink
Contact Us: admin [ a t ] ucptt.com