推 ********* : 希望別像前幾年一樣嚴重 06/08 23:47
這件事情我想需要解釋一下,不過這之前我們先來看一下數據資訊:
以下是這20年左右的數據:
1998 1999 2000 2001 2002 2003 2004 2005 2006
110 40 4 228 4813 77 60 144 956
2007 2008 2009 2010 2011 2012 2013 2014 2015
202 443 782 1099 1182 531 584 15058 19830
2016 2017 2018
318 37 56
以上是每個年度與登革熱的數據關係,基本上個人對於數據算是有一點興趣,
所以就做了一下分析,基本上我們可以去看這1998~2018的平均值與標準差:
平均值 2216.857143 標準差 5220.755283 中位數 318
偏態係數 1.091139331
基本上這是右偏的一個數據,也就是說多數的狀況之下是偏少,
不過常態分配比較容易來看,所以我們就假定是常態分配的結果
(其實是我懶得查換算係數表),
從機率來說2014年大概是2.4個標準差,也就是發生的機率小於2.5%,
再來看2015年的差距大概是3.3個標準差,也就是發生的機率會小於0.05%
如果回歸回來看這圖其實右偏態所以這些機率還會比常態分佈更小。
再回來看2016之後的數據位置結果:
2016 -0.3637131104 2017 -0.4175367403 2018 -0.4138974201
從常態分配的統計來說,這發生的機率大概是75%左右(右偏態所以會更接近這個值)
由上述的結果其實我們可以了解到2014和2015基本上在實驗上應該算是很大的誤差值,
那如果我們把數據拉回到只統計1998~2013年(基本上就是做子體分析)
那就會獲得以下數據:
平均值 703.4375 標準差 1127.336461 中位數 335.5
偏態係數 0.9791331499 不意外個往常態分配靠進了,
不過為了方便還是先以常態分配的結果來看2014和2015的狀況,
2014年 12.73316618個標準差 2015年 16.96615266個標準差,
這值發生的機率小於10^(-9)%,在回來看2016年之後的數據:
2016 -0.3419010325 2017 -0.5911611334 2018 -0.5743072476
這些發生的機率也都大於50%,也就是說2016年之後就又回歸到2013年前的數據狀態,
至於為什麼2014和2015發生了什麼事情,造成登革熱大爆發呢?
我想這都有討論的空間,不過從數據上來看2014和2015基本上就是很特別的值,
如果你想討論常態結果用2014和2015來討論基本上就是一個謬誤,
以下我們就來舉個例子來看這到底是多奇怪的謬誤:
假定你平常站在體重機上是75KG,大概每天量就是73~77這樣在跑,
但是有一天你站在體重機上發現到你的體重是99KG,請問你當下是反應自己變胖了?
還是反應這體重計有問題?
以上就是很簡單的數據分析結果,如果想更仔細其實需要更多的資訊。
如果你問我個人的意見,我目前查起來最大的差異在於"氣爆"......。
不過如果你是擔心是否2014和2015會不會重演?我個人認為是不太可能啦!
機率分佈的結果就是這樣,不過大家還是要多多留意自己的身體健康。
遲了兩天,端午節快樂。