[問題] 用BeautifulSoup解析的網頁碼與原本不同 ponwar87123 PTT批踢踢實業坊

[問題] 用BeautifulSoup解析的網頁碼與原本不同

作者: ponwar87123 (干我屁事喔北七) 2018-07-11 12:09:06

url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html'
html = urllib.request.Request(url,headers = headers)
req = urllib.request.urlopen(html).read().decode('utf-8')
soup = BeautifulSoup(req,features = 'lxml')
這是我餵給beautifulsoup的程式碼
我要抓取的內容是那個網頁裡面的"xfplay://dna.xxxxxxxx"也就是"先鋒傳送門"那裏的連結
但我發現beautifulsoup怎麼樣也抓不到
於是我直接print(soup)來看
發現沒有那個"xfplay://"
怎麼會這樣@@ 該怎麼辦

作者: Kazimir (Kazimir) 2018-07-11 17:18:00

那個網址看起來是js組出來的我覺得你要是不想動腦筋就用web-driver跑一遍自然有不然的話你看response 293行那段應該是給js的資料我猜應該可以用這個拼出下一層然後再從第二個檔案拿撥放器的url

作者: TakiDog (多奇狗) 2018-07-12 02:47:00

.name .herf 可以直接取值沒記錯的話等等name 在network 他是個封包吧，看你瀏覽器喂給他什麼去處理

作者: ponwar87123 (干我屁事喔北七) 2018-07-13 01:33:00

那我應該怎麼取得那個封包呢

作者: TakiDog (多奇狗) 2018-07-13 19:26:00

看你那個封包怎麼傳帶了什麼資訊，用Python仿造出來，依照你的說法你要的網址就在回應中

繼續閱讀

[問題] heroku django 重新導向問題Liliummy [問題] selenium模擬登入信箱但帳密不同頁waterlovers [問題] 時間複雜度分析sean72 [問題] Dataframe mean平均值問題powerkshs [問題] 如何爬蟲爬取同一個網頁不同標籤的超連結ponwar87123 [問題] windows 命令模式下的python xxx.py IPescorpion [問題] javascript K 線圖擷取yshihyu Re: [問題] 自動點擊網頁Hsins [問題] 自動點擊網頁WENroger [問題] 請問如何將程式碼以pdf輸出yiche