Re: [問題] 在學習程式語言,如何做到有效率的學習

作者: jamesxxx1997 (黃~)   2018-01-03 22:26:57
感謝大家的回應~在下沒有明確的指出問題爬蟲問題,是因為我想爬的網頁是付費網頁
(我是付費會員),有點怕被吉,所以用馬賽克馬了一部份,不好意思~
以下是在下的步驟
1. 登入"登入"頁面>>>https://imgur.com/a/oHQIY
2. 在網頁的上半部點選其中一個選項>>>https://imgur.com/a/p9Nj9
3. 在網頁的下半部會重新載入資料,同樣點選其中一個選項>>>https://imgur.com/a/CFQFO
4. 進入頁面>>>碰到有"點擊下載的連結時"就不會有問題(selenium),不然就會卡住~
>>>https://imgur.com/a/GHQ7C
4-1. 檢查元素,檢查不到影片網址>>>https://imgur.com/a/pmZKx
4-2. 在network裡面看不到檔案類型為media的file>>>https://imgur.com/a/qP6FV
4-1與4-2就是我所碰到的問題的總結
謝謝各位
作者: f496328mm (為什麼會流淚)   2018-01-03 22:53:00
這圖也太小了.......
作者: ckc1ark (偽物)   2018-01-03 23:40:00
m4s就是了吧 content type是video/mp4或audio/mp4
作者: vi000246 (Vi)   2018-01-04 00:11:00
這個網站我爬過 請去我的github挖寶吧提示:vimeo
作者: Kazimir (Kazimir)   2018-01-04 00:17:00
要不然就是先找到影片seg網址的list是什麼時候送過來的否則就是看看能不能直接對seg的網址丟request
作者: jamesxxx1997 (黃~)   2018-01-04 21:33:00
謝謝v大~真的太讚啦!不過從code看起來,我還有很多要學XDK大~請問甚麼是seg?
作者: Kazimir (Kazimir)   2018-01-05 01:13:00
在撥放器已經執行的時候不是有segment-1.m4s嗎我之前爬過一個串流是用m3u8裝所有segment的網址先傳過來然後撥放器再按照順序去下載這些分割 所以一種方式就是先去找到那個list在哪 解析以後就有所有的網址了另一種假設他的segment完全沒加密網址有規律 乾脆直接改網址就好

Links booklink

Contact Us: admin [ a t ] ucptt.com