感謝大家的回應~在下沒有明確的指出問題爬蟲問題,是因為我想爬的網頁是付費網頁
(我是付費會員),有點怕被吉,所以用馬賽克馬了一部份,不好意思~
以下是在下的步驟
1. 登入"登入"頁面>>>https://imgur.com/a/oHQIY
2. 在網頁的上半部點選其中一個選項>>>https://imgur.com/a/p9Nj9
3. 在網頁的下半部會重新載入資料,同樣點選其中一個選項>>>https://imgur.com/a/CFQFO
4. 進入頁面>>>碰到有"點擊下載的連結時"就不會有問題(selenium),不然就會卡住~
>>>https://imgur.com/a/GHQ7C
4-1. 檢查元素,檢查不到影片網址>>>https://imgur.com/a/pmZKx
4-2. 在network裡面看不到檔案類型為media的file>>>https://imgur.com/a/qP6FV
4-1與4-2就是我所碰到的問題的總結
謝謝各位
作者:
ckc1ark (偽物)
2018-01-03 23:40:00m4s就是了吧 content type是video/mp4或audio/mp4
這個網站我爬過 請去我的github挖寶吧提示:vimeo
作者: Kazimir (Kazimir) 2018-01-04 00:17:00
要不然就是先找到影片seg網址的list是什麼時候送過來的否則就是看看能不能直接對seg的網址丟request
謝謝v大~真的太讚啦!不過從code看起來,我還有很多要學XDK大~請問甚麼是seg?
作者: Kazimir (Kazimir) 2018-01-05 01:13:00
在撥放器已經執行的時候不是有segment-1.m4s嗎我之前爬過一個串流是用m3u8裝所有segment的網址先傳過來然後撥放器再按照順序去下載這些分割 所以一種方式就是先去找到那個list在哪 解析以後就有所有的網址了另一種假設他的segment完全沒加密網址有規律 乾脆直接改網址就好