KMT跟蔥哥好像太早上了這大兵川這班車~
前面有人提到了,去識別化資料是可以拿來分析的~
年紀、來自哪個縣市都可以分群,
至於519/524/528 可以看是否重複來,其實也不算太難,
就資料來源給予編號就好。
三天都來的給1
三天來兩天給2
519/524 2-1
519/528 2-2
524/528 2-3
三天只來一天的給3
519 3-1
524 3-2
528 3-3
全部共七組分群。
例如:
亂數碼A:2-1,嘉義,年紀20~30,男
亂數碼B:3-2,屏東,年紀50~60,女
亂數碼C:...
亂數碼隨機產出,無關連線索trace,只是避免資料表重複計算。
再分:
太陽花:
1-1:全程參加
2:n天參加m天
Sub_Group
只是時間跨距超過十年,改變的事情很多,資料可用性極低。
(以上分群還是找不到人即可)
這並不是太難的技術,癥結點在於這樣的資料是否觸犯隱私。
但個人資料保護法的定義是可以從資料找到你這個人。
兩筆獨特資料(例如,身份證字號+電話號碼)可以找到你,就是觸犯個人資料保護法。
你可以把身份字證號改成Unique_No1 電話:Unique_No2,因為有關連線索在,
可能還是違法疑慮。
不過如果以前述分群組的方式來執行,因為找不到單一個體,原則上不會有法律上疑慮。
至於政黨傾向,也可以從人口樣本調查比例去回推,
半年前才選舉完,各大智庫的調查統計資料,一定有各年紀/縣市/性別的政黨支持比例。
王義川這個人很賊,搞不好是佈好陷阱等人上車。
別太快上車啦。