再看了CDC跟雙北記者會後,想跟各位談談「校正回歸」的定義以及數據上不合理之處。
以下我會提出幾個問題,並從我手邊的資料提出一些想法,文長,不喜可以直接跳下去
看結論。
我想先簡單說一下我的背景,我剛好在美國念cs博士,資料分析是我其中之一的專長,對
於科學研究也還算略懂。又剛好碰上了紐約封城,也經歷了這段政府從認知到嚴重性、封
城、打疫苗、解封的過程(那時候每天都得看Cuomo的記者會)。我希望能從我所學的概
念與知識,跟各位討論以下問題。
Q:所以「校正回歸」的定義是什麼?
沒有定義。我認為這名詞99%是現在中央政府發明的。一個快速的檢驗方法是去GOOGLE
「 校正回歸 英文」或「校正回歸 研究」如果跳出來的都是些阿哩佈達的東西,那大概
就是沒有人在使用的玩意 (這邊先不談google 的權威性以及錯誤率,至少這方法在目前
一般狀況下都有很高的參考性)。 我再後來又看了雙北記者會跟陳時中的追加解釋
(ref. 1,2,3),大概得到的定義就是 「因為驗證檢驗結果的時間不夠,所以有一些試劑
驗證不完,只好之後處理完再補上數據」,這個時間不夠可能是key資料的時間不夠、報
到中央的時間不夠多、研究室辨識確診的時間不夠多...等等。
Q: 那「校正回歸」是新概念嗎?
不是,去年那麼多國家在做檢驗,他們也會遇到一樣的問題。 前面有些人文章提到的
「 testing backlog」(ref. 4,5) 就是很好的例子。backlog是指當要完成一件任務需
要做很多事情時間又不夠的時候,就挑優先度高的先完成。 簡單說,英國那邊的實驗室
說我們一天只能檢驗三萬筆試劑,你一天送三萬三千筆來,我們只能壓著三千筆以後驗
。但是每天都超收,壓的試劑就越來越多。所以要解決這問題,英國有幾天就把檢驗量
縮減,讓被壓著的試劑能驗完 (ref. 6)。
Q: 所以這個新名詞「校正回歸」,有什麼不好嗎?
有。 第一點,這名字爛透了。 「校正」是指把錯誤的東西改正回來。以上面的例子來
說,沒有一個是錯誤的阿,你早就知道你還有沒驗完的試劑,跟錯誤有什麼關係? 再來
,「回歸」這個更扯,回歸是指調整函數的係數使得它可以逼近資料上的實際值。 請問
上面的例子哪一部分跟回歸有關係? 取名也是有學問的,是要讓人能直覺聯想到你在做
什麼,而不是把很多fancy的字湊在一起就行了,你以為是在寫武俠招式嗎?
第二點,它的定義十分模糊,甚至包山包海,只要還沒來的及統計完的,都可以之後補
上再說我是校正回歸。我認為當政府給出一個新名詞,最重要的就是要把定義說清楚,
讓白癡都能懂,而不是用術語解釋術語來把事情複雜化。 當大家都不知道你在說什麼,
每個人就可以有各自的解讀,然後鬧烘烘炒成一團,最後沒有人能聚焦在真正該討論,
檢討的問題上。 政府公告的對象是民眾,有十幾歲的年輕人,也有八十幾歲的老人,你
本來就要盡力讓每個人都懂,這樣所謂的假消息才沒有插針的空間。
Q: 既然會有這些辨識不完的例子,那麼,經過「校正回歸」後的數據有什麼不合理嗎?
有。第一,這個回報後的比例高到很怪。各位可以看CDC更正後增加的確診數量每天大概
是20%到30%的。如果合理懷疑沒被驗到的試劑是隨機抽樣的(也就是政府不是刻意隱瞞
疫情),那就代表每天有大概至少20%的試劑沒被驗到,這是很嚴重的事情,絕對不該拖
到這週週末才跟大家講。另外,政府還是沒說這些壓著的試劑是不是都驗完
了,會不會沒驗完的試劑其實比你我想像的多更多。更何況現在我們的檢驗數還很低就塞
車這麼嚴重,那以後呢? 去年紐約一開始Cuomo就很強調要提高檢驗能量,就是在處理這
種事情。第二,每天的工作量就這麼大,這段期間我也沒有看到增加了公務
人員還是實驗室人員。那怎麼週末就可以把這些壓著的試劑處理完了?要知道英國為了這
件事情可是在去年九月焦頭爛額了好幾周。這都是應該好好說明的部分,而不是,「因為
我們進步了,所以把塞車的地方都處理完了(ref: 1)。」把事情透明化出來,民眾驗完
是怎麼送實驗室的,實驗室一天驗多少,驗完怎麼報上去的,有多少數據還沒來的及處理
。你先公開,民眾才能討論、知道到底是哪邊效率不好、哪邊沒跟上,所以才會有部分的
檢驗數據被壓下來,你之後的東西才有公信力。不然你這次冒出一個「校正回歸」、下次
發明一個「卡方補正」又給你加些確診,這樣你之前做的統計還有意義嗎? 一樣,你政府
既然這麼重視打擊假消息,那為什麼還要留這麼大的模糊空間而不把事情透明化,不把事
情講清楚?