[心得] 終於把蔡XX網站的影片爬下來了~心得分享~

作者: jamesxxx1997 (黃~)   2018-01-28 16:12:44
大家好,這是我之前下載影片時碰到的困境
https://goo.gl/rs7tQG
發現解法了!!!
其實完全不用管segment,其實網站把影片url藏在iframe的javascript中
那我是怎麼找到的呢?
直接在chrome dev tools的element中ctrl+F,打上.mp4!!!

以下是我的程式碼(別忘了driver.switch_to.frame(0)來抓iframe中的javascript原始碼)
https://pastebin.com/BwWZ71m4
謝謝!!!
PS1.看完大數學堂了,不過針對scrapy有些比較難的部分(ex.downloader middleware)
只有找到幾支免費的教學影片,還有人推薦嗎?感謝!
PS2.有人有其他進階的爬蟲下載教學,也歡迎分享!!!
作者: vi000246 (Vi)   2018-01-28 21:40:00
scrapy直接看官方文件 或是買書吧
作者: jamesxxx1997 (黃~)   2018-01-28 23:40:00
官方文件有時候看不太懂ㄝ影片比較容易吸收~
作者: modelfucker (喂,禮安)   2018-02-02 20:42:00
那如果影片的src是沒有副檔名的呢?來源點進去都是直接access denied這種我搞好久還是都抓不下來
作者: galeondx   2018-03-06 04:35:00

Links booklink

Contact Us: admin [ a t ] ucptt.com