[問題] Beautifulsoup的問題

作者: kanako (我是香民)   2014-03-10 11:04:28
我在解析網頁時遇到某個欄位tag的層數不固定
可能的例子:
1.<div>範例</div>
2.<div><div>範例</div></div>
3.<div><div><p>範例</p></div></div>
想請問一下我要如何處理以上三種狀況,才能正確取出範例這兩個字?
只能用regular expression嗎?
謝謝
作者: jokester (蠻王科科)   2014-03-10 12:09:00
可以po一下代碼嗎? 我用BeautifulSoup.getText()就拿到
作者: qwertmn (抽筋)   2014-03-11 01:45:00
In [1]: from bs4 import BeautifulSoupIn [2]: body = BeautifulSoup('<div><div><p>範例</p></dIn [3]: body.text這樣抓不到媽?

Links booklink

Contact Us: admin [ a t ] ucptt.com