[問題] 有沒有高手可以直接教我爬抓資料2000p

作者: wwman (記憶拼圖)   2020-07-14 09:37:38
想要找某網站的影片資料 希望有高手大可以幫我 如果可以的話
若不嫌棄 願意以2000P幣 表達感謝(若難度真的很大 願意加倍p幣 4000p)
希望有高手大大可以直接教我 怎麼爬抓資料
因為不太可能學程式 但又想抓取某網站的全部資料
但是網站應該是採 以下這兩種網址的格式的範例
(先說明https://v1.abcde.com/ 並非我要找的網站 但網址不方便公開寫出來
所以用abcde代替掉原本的英文字)
(大概還有兩三百個類似的網址的影片 但是我因為不知道數字規律是什麼
所以無法觀看 或下載下來)
第1種
https://v1.abcde.com/u/video_url/2020/0318/1584535407176.mp4
https://v1.abcde.com/u/video_url/2020/0318/1584535618170.mp4
第2種
https://v1.abcde.com/micro-course/u/2020/0703/160954788558.mp4
https://v1.abcde.com/micro-course/u/2020/0702/150101129441.mp4
https://v1.abcde.com/micro-course/u/2020/0702/131029435944.mp4
https://v1.abcde.com/micro-course/u/2020/0702/150753855576.mp4
https://v1.abcde.com/micro-course/u/2020/0702/150921758347.mp4
abcde是我亂打 打成別的英文字 來代替原本我要找的那個網站的5個英文字
因為不方便公開 如果有哪個高手大大願意幫助我 我在私信那個網址
因為我點開原來的 https://v1.abcde.com 開頭的主網址 只會顯示
This XML file does not appear to have any style information associated with
it. The document tree is shown below.
<Error>
<Code>AccessDenied</Code>
<Message>The bucket you access does not belong to you.</Message>
這個網站 因為不會直接顯示出可以點取的物件
我要找的那些影片網址 都是未知的隨機數字組成 然後藏在以上這兩個網址規律
的子目錄下
頂多能從2020得知是年份的規律 和 幾月幾日
後面檔名 真的看不出什麼規律 但是我已知的就是都是mp4的檔案
因為是未知網址 所以大概要用爬蟲設定慢慢找這樣
大概我也知道 爬抓也可能會被防禦被抓到是爬蟲的ip而ban掉對吧
但是看過程式教學 覺得還是太高深 沒時間花兩個月以上去研究這個程式
所以想請問有哪個高手大 可以直接幫我 或教我怎麼爬抓
如果難度很大 本人願意在更多加倍p幣交換 當作答謝 再請麻煩私信我~
作者: ddavid (謊言接線生)   2020-07-14 10:03:00
你不如直接出錢委託還比較實在迅速XD
作者: Pieteacher (pieteacher)   2020-07-14 12:21:00
p幣實在讓人不心動
作者: s860134 (s860134)   2020-07-14 12:34:00
P幣能幹嘛 消費券?
作者: bugbug777 (sil)   2020-07-14 13:06:00
哈哈
作者: andy19960407 (258698)   2020-07-14 13:47:00
是要要爬a片嗎 網路上的影片有甚麼好不公開的==
作者: sherees (ShaunTheSheep)   2020-07-14 15:08:00
P幣…
作者: wwman (記憶拼圖)   2020-07-14 18:12:00
本人目前回歸窮學生狀態 可能只能出得起P幣 對不起要幫我的人了 或者再以運動類技能交換 (台中市~
作者: rs6000 (正義的胖虎)   2020-07-14 18:45:00
直接把網址秀出來搞不好就有人閒閒沒事幫你寫?
作者: qwerasdft (小夜)   2020-07-14 19:29:00
說說網址阿
作者: alvinlin (林矜業)   2020-07-14 19:29:00
回你了。可以用https://github.com/ytdl-org/youtube-dl裡面有程式碼給你參考。也有做好的執行檔
作者: TuCH (謬客)   2020-07-14 19:33:00
看錯誤訊息起來是AWS S3的 API 沒有索引有點難搞看看有沒有辦法從其他地方找到索引吧
作者: wwman (記憶拼圖)   2020-07-14 20:18:00
樓上alvinlin大 好像誤會我的意思了 就已知的網址 我都可以下載 但是就是想要知道未知字串的網址 只知道大概的規律所以想請教 有沒有能直接爬出所有藏在主網址下面所有網址的影片我有用直接複製整個網站的程式 但好像無法複製不過還是謝謝alvinlin大和tuch大 跟樓上幾位
作者: alvinlin (林矜業)   2020-07-14 22:24:00
不客氣^^。沒幫上什麼忙另外FYI就是後面的網址看起來是timestamp,到毫秒。但我覺得還是沒什麼幫助。
作者: Jekk (Lestrade)   2020-07-14 22:52:00
捐個血就可以拿到5000p幣 你給個4000p真沒吸引力
作者: refusekkk (另類3k)   2020-07-15 12:15:00
你不如乾脆一點講清楚是哪個網站,搞不好就有高手回你了

Links booklink

Contact Us: admin [ a t ] ucptt.com