大數據重點在於過去我們統計學都敘要使用抽樣統計,現在大數據的觀點「母體=樣本」,避免掉了我們樣本跟母體會有誤差的情形,在過去電腦處理數度和資料的儲存量沒有這麼的龐大,分析這些數據要曠日費時,現在隨著科技的發展電腦處理的數度越來越快,慢慢的我們可以使用整個母體來做分析,去除掉樣本的不準確性。
如何去解決登革熱,其實登革熱每年都會發生,在於說他的流行程度,跟腸病毒、流感…等疾病一樣,中央氣象局的資料,7和8月份台南地區幾乎天天都有降雨的發生,而一支病媒蚊的生長時間大約在兩個禮拜,因為連日大雨導致許多積水導致病媒蚊大量繁殖,才會造成這麼嚴重的疫情的原因之一。
透過過去民眾的就診紀錄來去做交叉分析,根據性別、居住地區、年齡…等資料,來鎖定特定區域,由患者的生活範圍鎖定病媒蚊密度較高的區域做藥劑的噴灑,也定期派環保局去巡視看有無積水未處理的情況發生,把重點放在特定區域去做有效的控制,針對好發的年紀和族群做預防性的措施,例如:國中小可實施全面的體溫量測,避免出入病媒蚊密度高的區域。
大數據分析比較注重在如何去做「預防」,因為等到真正流行起來財來開始分析數據也就太遲了。