※ 引述《richjf (richArt)》之銘言:
: 資訊龐大 簡訊實聯制疫調無用
: 2021-06-29 02:28 聯合報 / 記者蔡孟妤、徐如宜/高雄報導
: https://udn.com/news/story/122173/5564273
: 簡訊實聯制。聯合報系資料照
身為一位無名的後端工程師,我覺得還是要以業界人的出來講一下
不然一堆人沒搞清楚,隨便亂說實在不太好
要追蹤人去哪裡,需要的就是
{人,什麼時間,什麼地點}
當有人被判定確診後,就可以進去撈
這個人在病徵出現往前14天到被收治為止,有什麼時間,什麼地點
時間,地點知道後,就可以針對每個地點,抓前後幾小時的時間
列出進入這些地點且在特定期間的有哪些人
列出來的人除了是確診高風險之外
如果這些人之中已經在先前確診收治
可以假設這些較早發現的確診者們與此位確診者有接觸史
這些搜尋動作,其實在 SQL 體系的資料庫內都可以很簡單地描述
而且已經有鄉民寫了 SQL,我就不再寫一次
非SQL的 key-value,document,graph DB 體系也有對應的查詢寫法
有興趣看要怎麼做的可以去看看各 DB 的官方便用教學
雖然說查詢動作可能看執行環境配置,不一定能一口氣完成
但因為疫調資料請求者的數量,應該是遠不如普羅大眾上傳簡訊的數量來得多
其實有個操作介面可以發動背景task,讓他跑deferred查詢都是可行的
不一定要做網路服務大多數API那樣需要瞬間回應
我個人認為最麻煩的,也許是申請查詢個資這方面的政治問題,而不是技術問題
其實我相信有一定後端經驗的人,都會想到這些資料系統規劃面要怎麼量身訂做
而且在有確實建好 index, 以及在資料量夠大時做 sharding
就算是幾億筆,單一的查找,就算資料規劃沒有做進階的最佳化,都可以在幾亳秒內解決
比較有點挑戰性的是從特定確診者 join 出相關接觸者,但這也不是不能做到
不然那些銀行信用卡電商怎麼可能營運?
簡訊實聯制的消息剛出來的時候
其實我個人最佩服的點並不是前面提的,這些資料的搜尋要怎麼做
因為這些都只是資料庫基本功而已
最重要的是,只要用簡訊,就可以收集這些可以用來疫調(還是抓逃犯?)的資料
傳簡訊,含商家代碼,就能成功地取得{手機,地點,簡訊傳送時間}
而且公佈推行時間點拿捏也抓得很好
這正好是前面說的要做足跡追蹤時需要的 人 時 地 的取得方式
資料有了,怎麼用就看使用的人怎麼用,工程師要怎麼自動化
但是只要掃 QR code 發簡訊就能提供資料這點,大大降低了提供資料給系統的門檻
安裝 app 有一些普通 3C 使用者看不到的阻礙
有些人可能是手機太舊無法裝 app, 有些人就是沒有用較現代的智慧型手機
像我個人就因為卡在使用 app 必須要升級手機 OS,晚了3天才裝接觸者通知
這還是因為我手機有2FA與各種憑證用途,升級變磚對個人會造成很大困擾
簡訊實聯制也許不是很完美的做法
因為要實施這方法,要有能力有資源跟電信商喬,不然難道要大家都自費上傳簡訊?
但綜合多方面的利弊因素,包含使用門檻,資料收集,與電信商協調等等
也許它對實施者(政府)來說,是可行,且各方面都取得相當程度平衡的一套方法
目前全台的新增確診人數還緩慢減少,要完全撲滅傳染源,需要的是更完善的疫調
不管大家喜歡什麼方式留下足跡或是甚至不想留,還是希望大家可以做好份內的防疫工作
有用的方式,大家就多配合
沒用的方式,丟出來以合理的觀點批評討論都沒關係
讓你我多思考,進而補強漏洞,但不需要無理抹黑來鄙視他人的方法
也不要以為打了疫苗就金身護體
異物進入細胞這些事其實在你我的身體都天天上演,只是會不會得病致死而已
重點還是有沒有做好自身衛生習慣,病毒量不夠起連鎖反應,對身體也不會造成威脅
共勉之