Fw: [爆卦] i'Analyseur 的重大問題

作者: hancel (hancel)   2018-10-26 14:44:16
※ [本文轉錄自 Gossiping 看板 #1RobscDT ]
作者: hancel (hancel) 看板: Gossiping
標題: [爆卦] i'Analyseur 的重大問題
時間: Sat Oct 20 06:41:37 2018
現在有很多鄉民/黨工喜歡用i'Analyseur,
來分析/抓出 五毛/黨工....
i'Analyzeur的設計策略基本上是對的,
就是利用ip/登入時間/文章列表來抓出不尋常/異常的行為.
但是裡面的ip紀錄的擷取方法,很明顯是有bug的,
或者是說,有不盡完善的地方.
因為這個bug,大家所看到的ip交叉分析是有對有錯.
可是有對有錯,代表如果大家直接用這個結果來分析,
很容易推導出錯誤的結論.
首先,先拿八卦版版主的ip紀錄來看好了
https://www.ianalyseur.org/user/RandyMarsh/
https://www.ianalyseur.org/user/IbakaBlock/
https://www.ianalyseur.org/user/jacklyl/
https://www.ianalyseur.org/user/girl55665566/
https://www.ianalyseur.org/user/PPTplayer/
https://www.ianalyseur.org/user/RS5566/
靠,這幾個人是分身大王啊?
IP遍佈各地,甚至到國外去了.
如果你有這個結論,那你就已經被i'Analyseur的bug給愚弄了.
i'Analyseur的ip紀錄,應該有根據發表文章上的ip/時間,
做為上線ip以及時間的紀錄之一.
但是這個parsing(懶得解釋了)一定是有bug的.
會把一篇文當中引用其他人的文的ip/時間也算進發表人.
"請問要引用原文嗎(Y/N/All/Repost)?[Y] r"
裡面一般的Y引用可能是沒問題的(因為只留文章,且加":"),
但是Repost引用(沒有前置":")會導致,
被引用跟引用者兩人身分的混淆.
這就導致喜歡引用它人發文/發文常常被引用的人,
有機會會混在一起分不出來.
本篇文章中的諸位分身大王,
就是因為常常要開水桶藥單,
必須引用許多文章最為裁決證明,
導致錯誤結果.
結論:
在i'Analyseur的ip紀錄的parsing bug解決,
並將整個資料庫重新更新之前,
最好不要"直接"用它做重大指控,
參考可以,但是下結論之前,
自己最好多動手觀察/紀錄,
確認之後在說吧.
畢竟搞出烏龍被告被酸的時候,
i'Analyseur它也不會幫你扛的.
另外,bug未修之前,有心人想要故意搞亂這個資料庫也是沒問題的.
例如,把我下面那三行前面":"去除,
放到你的文章當中,
你可能就會多了三個有來頭登錄ip了.
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.130.192.150
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.8.116
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.92.207.178

Links booklink

Contact Us: admin [ a t ] ucptt.com