[問題] 用BeautifulSoup解析的網頁碼與原本不同

作者: ponwar87123 (干我屁事喔北七)   2018-07-11 12:09:06
url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html'
html = urllib.request.Request(url,headers = headers)
req = urllib.request.urlopen(html).read().decode('utf-8')
soup = BeautifulSoup(req,features = 'lxml')
這是我餵給beautifulsoup的程式碼
我要抓取的內容是那個網頁裡面的"xfplay://dna.xxxxxxxx"也就是"先鋒傳送門"那裏的連結
但我發現beautifulsoup怎麼樣也抓不到
於是我直接print(soup)來看
發現沒有那個"xfplay://"
怎麼會這樣@@ 該怎麼辦
作者: Kazimir (Kazimir)   2018-07-11 17:18:00
那個網址看起來是js組出來的 我覺得你要是不想動腦筋就用web-driver跑一遍自然有 不然的話你看response 293行那段應該是給js的資料 我猜應該可以用這個拼出下一層然後再從第二個檔案拿撥放器的url
作者: TakiDog (多奇狗)   2018-07-12 02:47:00
.name .herf 可以直接取值 沒記錯的話等等name 在network 他是個封包吧,看你瀏覽器喂給他什麼去處理
作者: ponwar87123 (干我屁事喔北七)   2018-07-13 01:33:00
那我應該怎麼取得那個封包呢
作者: TakiDog (多奇狗)   2018-07-13 19:26:00
看你那個封包怎麼傳帶了什麼資訊,用Python仿造出來,依照你的說法你要的網址就在回應中

Links booklink

Contact Us: admin [ a t ] ucptt.com