[問卦] 去識別化後資料,怎麼看是否重複出現?

作者: NTUBIGGG (台大G)   2024-05-30 12:23:02
是這樣子,最近正在寫論文,所以想知道抽菸人口跟肺癌有沒有關聯,我手上可以拿到的是
兩份去識別化之後的資料。
我可以知道抽菸人口的特性(男女、年紀、…)也可以知道肺癌人口的特性(男女、年紀、
…),但我要怎麼知道這兩筆資料裡面交集的人數有多少呀?
雖然我自己覺得是不可能從去識別化之後的資料找出交集的人有哪些,但指導教授的一句話
,讓我不知道怎麼反駁。
教授這樣說:「517跟青鳥的人有沒有重疊,人家拿去識別化的資料就可以弄出來,為什麼你
說你弄不出來?你不會弄就去查台大土木是怎麼教學生的呀,為什麼台大土木畢業的學生就
可以弄出來。」
有沒有方法可以找出兩筆去識別化的資料,裡頭有沒有重疊的人?基本上我覺得真的有,早
就可以得菲爾茲獎了。

Links booklink

Contact Us: admin [ a t ] ucptt.com