[問題] 用beautifulsoup find_all沒找齊對應資料 Mutibil PTT批踢踢實業坊

[問題] 用beautifulsoup find_all沒找齊對應資料

作者: Mutibil (nujabes) 2017-11-17 14:19:54

使用python 3.5版本
最近想摸一下beautifulsoup的功能
所以想爬broadway的網站，寫個簡易查詢時刻表等功能
問題是這樣的
先附上code
url= 'https://www.nyc.com/broadway_tickets/'
html = urllib.request.urlopen(url).read()
soup BeautifulSoup(html, 'html.parser')
dramaName = soup.find_all('h2')
dramaList = []
for i in dramaName:
Print(i.string)
dramList.append(i.string)
劇名是放在h2 底下，但我用find_all去找body底下的h2標籤
只能找出局部的資訊，沒辦法找出所有的劇名
爬了一下stackflow，有看到有些網站支援問題
有嚐試把html.parser換成lxml，但問題還是存在
想請問有可能朝哪個方向去解決這問題呢？
謝謝

作者: Mutibil (nujabes) 2017-11-17 14:51:00

我是用developer tool看想說看起來都在同一頁底下但剛剛看了一下page source 好像真的就那些資訊謝謝你我再試試看

作者: ckc1ark (偽物) 2017-11-17 14:31:00

用developer panel可以看得出來他有querywww.nyc.com/broadway_ticketselements/?page=2 ~page=12

繼續閱讀

[問題] 如何將爬蟲下來的文字套進其他文章格式orz77586 [問題] dataframe處理asghdf123 [問題] 初學用Mac遇到permission deniedyaboo [問題] windows環境下安裝matplotlib出現錯誤pig98520 [心得] 解決python3 IDLE開啟沒反應jackflu [問題] 有辦法將多個列資料群組起來嗎？zcyee [資訊] 機器學習讀書會歡迎加入seiching [討論] python type hintssplasky [問題] pyinstaller打包SpeechRecognition問題MOONY135 [問題] 請問資料視覺化函式庫與Web框架cjcmt