※ 引述《chal ( )》之銘言:
: 假設我開電信公司
: 我可以把我的客戶資料
: 一、去識別化以後
我是不知道你所謂去識別化能做到什麼程度啦!
我國個資法第2條第1款定義須受本法規範之「個人資料」為「得以直接或間接方式識別該
個人之資料」。透過本條文義之反面推論可以得知,透過一定程度之加工或技術處理,使
個人資料喪失直接或間接識別之可能,破壞資料之個人屬性後,該資料即非為個資法所保
護之客體。
歐盟第29條資料保護工作小組所言,必須達到不論是資料控制者(data controller)或
是第三方(third party)皆無法採取可能合理之手段識別出特定資料主體之程度,換言
之,資料經加工後與特定資料主體之連結徹底斷絕,毫無重新識別之可能。
: 二、同步到另一個表格
: 三、此表格另由統計分析部門管理
: 這表格有紀錄 年紀 性別 發信地點 時間
: 還有一個電信公司內部的固定SID
: 但 沒有 紀錄身份證
: 也 沒有 紀錄手機號碼
: 所以可以很簡單的查詢出
: 在某地某時的群眾的年紀與性別的人數
基本上,這就不符合無法知道資料主體,因為你的年齡就具識別了。
但是這些都不是重點,重點是為什麼他可以對不同資料量進行比對這件事?
也還能區分出年齡層這件事。
: 也可以很簡單的查出
: 兩個活動的差別
: SELECT s.sid FROM 小草芭樂斯坦 s WHERE NOT EXISTS
: (SELECT * FROM 青鳥行動 t WHERE s.sid=t.sid)
所以你的資料量那裡來?
你一定要去標簽化這些資料,才能進行比對吧!
所以你的動作是,取得資料、標簽化、透過演算法進行分析。
你自己去查王義川在電視上講的:
「有些是小草,有些是太陽花的,佔了整個活動的六成。我們用手機去看他們的年齡,差
不多六成。20歲以下的,大概佔了1成2,所以大概有7成2是70歲以下的。」
他是己經有區分年齡了喔,你如果真要依歐盟的標準?你連年齡都不應該有咧。
: 這樣就可以查出
: 有去小草芭樂斯坦但沒去青鳥行動的人
: 反過來也可以查出
: 有去青鳥行動但沒去芭樂斯坦的人
: 唯一揭露的就是SID
: 但你不知道誰是誰
: 這裡面完全不涉個資
你所有的法規標準拆開來,本來就各個部份,都不會涉及個資。
但是重點他有辦法把數據進行標簽化這件事啦!
什麼叫標簽化?
當年黨衛軍對所有的猶太人貼上大衛之星,就是標簽化。
: 另外有人說如何得到十年前的太陽花資料
: IPHONE都出到15代了
: 所以十年前有這些統計分析也不會太奇怪
你統計分析而成的數據,單筆來看都不是太大的問題。
問題是你要怎麼將這些數據和519進行比對?
兩筆不同的基地台流量單純比人多和人流嗎?
重點是你怎麼對不同時期的數據,進行標簽化?
然後再比對所謂的數據代碼?
取得流量數據,和取得數據代碼內容是不同的概念好嗎?
不要偷換概念了。
: 不過我看王義川的原話應該是說
: 有一大部分的人不是太陽花的年紀
: 並不是去調十年前的統計資料