安安,你也Work from home嗎?
先說,從你提供的資料我沒有看到333在哪裡.... 看到的是476?
但我還是先用你給的數字算一下,驗證你的假設..
※ 引述《rey123123 (小肥羊)》之銘言:
: 因為時間不多,我只拿5/17的確診人數做分析,但其實其它天數也有類似的狀況。根據
: CDC公布的資料,從第一次校正回歸開始到現在5/25號為止,5/17的確診人數從333增加到
: 510,多了52.2%。 再來,假如公視在5/23節目中所提供的數據為真,可以得知5/17共有
: 8458已通報,其中未確定的病例有1801。我這邊假設5/17已經不會再有校正了 (雖然我覺
: 得不可能)。那簡單的推算可以得知,
: 校正回歸前,已驗完 6657 (8458-1801) 例,其中333例為陽性,佔 5%
這邊校正前陽性率OK
驗到的陽性 (333) 除以 總驗量 (6657) = 5.0%
: 校正回歸後,增加 1801例,其中177(510-333)例為陽性, 佔 9.8%
再來我們算校正後的陽性率,一樣的邏輯,應該是:
驗到的陽性 (510) 除以 總驗量 (8458) = 6.0%
"增加的陽性率",不該是你那樣算的。
應該是要 "校正後的陽性率" 減去 "校正前的陽性率"
以你的假設而言,校正後增加的陽性率應為 6.0%-5.0% = 1%
這也符合你下面說的假設...
: 可以看到,新增加的病例,陽性率為將近兩倍。統計角度來看,因為驗的數量都是幾百、
: 幾千例的規模,這兩個比例應該要差不多才對 (e.g. 5% vs 5.5%),而現在這個變動幅度
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
你的假設。
你的假設:校正前後陽性率應該要差不多。
待驗的因為有許多不確定的因素
1.包含人為判定是否先驗後驗或是晚key in,隨機的程度就。
2. 地區的疾病盛行率(存在的疾病數/人口數)不一樣,新增加的不會等於整體的疾病流行狀況。(推文網友給的想法)
所以你的增加的陽性率,不一定會類似於 第一次的陽性率。
再者,你如果覺得不合理,建議你應繼續探究其他天或是如我這般的算法,再來提出懷疑。
: 之大,已經完全無法用隨機發生這概念去解釋了。甚而,如果5/17還有沒驗完的病例,
: 那更不止9.8%這個數字。
: 合理來看,我認為只有以下幾種可能:
我原本說質疑你的統計,抱歉,我就先刪掉這樣的comment了。
數字的修正主要主要主要是要評估疾病傳播的短期/中期/長期趨勢。
模式之間本來就會有一些不確定性。
你在去年的時候,檢驗量小,你可以每天report小數量的case,不需要回去補數字。
現在量大,要推估趨勢,勢必要做一些未補登的case。
我數年以前至少也有3年的化學樣品分析經驗,所以講一下自己的想法
即使rtPCR可以2小時內完成一批樣本的分析,但是...
分析前需要前處理、機器的清潔、試劑的配置
分析後需要數據的判讀,報告的輸出、key in... 這些都需要人力物力跟時間。
我個人認為,要提升檢驗量,中央的標準作業程序規範出來後,給合格的實驗室進行分析
才有辦法解決分析量的,不過這些事情。去年沒事的時候就要做,現在在做都太慢。
下面我在依照你的邏輯去計算,我時間也不多,但依照你給的資料跟邏輯..
https://imgur.com/kxRNWOe
數字就交給你解讀了
如果要算,應該要拿 CDC的資料跟公視的資料 的日期應該要一致,
然後算到 5/23會比較精準(考慮到+2 day)。
補充一下,看單日這件事情,不確定性太多,建議多看幾天。
你看股市,也不是看單日,是看長期的趨勢,對吧?
以上
Best regards,
peterwu76