[請益] 爬蟲是容易觸法的行為嗎?

作者: bajifa (銀河)   2018-06-16 23:24:53
不好意思 打擾大家
最近在學習爬蟲
小弟想請教
假設做書籍資訊相關的爬蟲
而資料來源打算用網路書店的資料(內容包含 書名 價格 出版社......等 公開資訊)
在遵守Robot.txt的情況下,會有任何可能會觸法嗎? 會不會被認定同一秒發太多請求對
他們伺服器是攻擊的行為?
會問這個原因是因為之前爬一些國外網站有被Ban ip,雖然可以用代理解決,但會不會這隱
含被告的風險呢?
網路上找了很多資料,但沒有一個詳細的解答,有人說會,也有人說不會,也有真的起訴成功
和失敗的案例,但資料來源都是在中國,不知道在台灣能不能這樣做
(btw 假設一秒請求16次的情況下)
先謝謝大家了 最近被這個問題困擾很久
作者: ripple0129 (perry tsai)   2018-06-16 23:48:00
《刑法》第360條規定:「無故以『電腦程式』或其他電磁方式干擾他人電腦或其相關設備,致生損害於公眾或他人者,處三年以下有期徒刑、拘役或科或併科十萬元以下罰金。」。有辦法舉證你損害公眾或他人才有辦法告吧。也就是你沒把他搞到服務失常應該是告不成。
作者: vi000246 (Vi)   2018-06-16 23:53:00
既然會ban IP 就代表別人不想你爬資料了
作者: readonly (唯讀)   2018-06-16 23:54:00
一秒16次還好…你要考慮的不是這方向…找暫時性重製
作者: THEWORLDS (天下)   2018-06-17 00:49:00
走到法律這一個第部不太可能會發生你放心 除非你是用學網去爬某些網站導致人家當機那真的要賠錢沒錯
作者: kappakappa   2018-06-17 01:00:00
假如1秒請求16次網站就會掛點,網站要告的應該是開發那網站的工程師吧...
作者: jimmy689 (吉米蛆蛆)   2018-06-17 01:01:00
前年美國有判例,有廠商爬linked被吉,法院判無罪,理由是linked數據以公開方式供大家取用,後來linked就改成只有登入後才看得到完整數據了。
作者: kappakappa   2018-06-17 01:02:00
爬蟲比較多的問題是copyright issue吧
作者: ChungLi5566 (中壢56哥)   2018-06-17 01:14:00
大公司的對外網站防火牆都有ddos防護設備然後你這個可能普通防火牆就自動ban ip了
作者: king4647 (發呆)   2018-06-17 01:24:00
看你爬的程度 之前聽說 有人爬掛新聞網站 結果人家找上門 最後和解把資料買下來
作者: Rocker5566 (搖滾56)   2018-06-17 10:00:00
那那些比價網站是如何做的呢?
作者: TitanEric (泰坦)   2018-06-17 10:21:00
我五分鐘固定爬一次就被ban了QQ
作者: ap954212 (death is like the wings)   2018-06-17 11:06:00
模擬成瀏覽器也會被ban?
作者: alog (A肉哥)   2018-06-17 11:09:00
要有刑責或民事侵權都要看狀況認定包括舉證內容有沒有到位,但基本上一個原則是人家設下了一個門檻比如說驗證碼或是特定的驗證防護方式就不要太白目硬要去解,包括不要把別人的服務搞掛向樓上的新聞網站搞掛 有可能得賠上一筆費用,雖然說一篇新聞稿授權轉載的授權費用沒多少但是量多起來還是挺客觀的另外有些內容跟資訊是屬於該公司特有,著作權還是要顧一下,免得服務上線,該公司的法務找上你和解都是100~200k起跳(律師費+實際侵權程度跟奇摩子)不過另外說的是爬蟲其實也沒說好爬,因為通常正常來說內容類的平台網站會有類似 limit request 的 module 掛在伺服器設定上,有些是因為上cdn省waf或是上好cache不怕你爬,你只是其中的使用者而已,沒有持續一直同步 mis/it 根本不會處理你只是後續就是剛講的,資料怎麼來的,拿了不該拿了會不會有問題很難說,包括你圖片內剛好有別人的商標又另一件事情了最後總結是做資料研究 -> 低調、不要礙到人為主做服務平台、或轉售資訊 -> 找律師事務所付費諮詢再補充下,這方面其實不只是爬蟲而已,像你如果平台給員工維護,然後你沒有盡好責任監督上架內容有問題,雇主也是有連帶責任的所以說你會顧慮到爬蟲的法律問題 我覺得是非常好的但因為網友不可能知道你究竟真正的目的要用在哪裡若你有已知的風險但無法評估究竟影響到程度或責任有多大 你就必須要找相關專業的人幫你看 例如你的是法律問題若有必要就是找專攻或是相關問題有實務經驗的律師事務所去詢問(但這是經驗跟專業正常情況不是免費幫你的,所以會有一定的收費)
作者: bajifa (銀河)   2018-06-17 12:01:00
非常謝謝大家的意見,這樣我以後爬蟲到時候會更謹慎並且注意是否遵守他們網站的規則還有網路禮儀
作者: crossdunk (推噓自如)   2018-06-17 14:37:00
alog你要不要回一篇
作者: wildli0422 (wild)   2018-06-17 18:27:00
樓主拜託不要刪文阿
作者: davidtnfsh   2018-06-17 20:26:00
alog大大專業
作者: aszx4510 (wind)   2018-06-17 20:59:00
alog大大自己回應一篇吧 若原PO自刪這些心血就沒了
作者: eva19452002 (^^)   2018-06-17 23:16:00
google搜索引擎也是爬蟲而來,會有alog提到的問題嗎?
作者: vi000246 (Vi)   2018-06-17 23:33:00
google的引擎有遵守robots.txt啊 只爬公開資料
作者: y3k (激流を制するは静水)   2018-06-17 23:38:00
換句話說只要遵守robots.txt(X
作者: chocopie (好吃的巧克力派 :))   2018-06-17 23:42:00
作者: VIGUTA (黃道第十四宮-魯蛇座)   2018-06-18 07:34:00
4縮 ptt給人爬爽的 是不是該吉一波當作一輪募資啦?
作者: fantasywater (prepare myself)   2018-06-18 12:17:00
結論其實就是違法,只是你怎麼做到人家不會告你而已
作者: alihue (wanda wanda)   2018-06-18 12:22:00
比價都結合導購返利,你告了營收反而會變低…
作者: leicheong (睡魔)   2018-06-20 10:00:00
記得也有違反網站的TOS被民事提供的樣子. 他們也不是要索償, 只是要求法院頒令在相關資料移除前關站而已提告
作者: fbifxxkma (FBI帥哥恐嚇騜)   2018-06-20 15:06:00
很久以前台北市政府怎麼告 某公車app作者的?有點忘了 還把人家搞到下架

Links booklink

Contact Us: admin [ a t ] ucptt.com