Re: [請益] 如何教大家"正確"解釋統計數據呢?

作者: wayne0824 (萊恩)   2017-09-26 04:15:12
原文恕刪,就算被台大事件的風波蓋掉新聞,我也還是要上來回一下
本人沒有念台大也沒有什麼高就,就是個說書的而已
接下來就用我所知道的數學來回應一下這個問題~
開始囉!
https://imgur.com/dbas0XO
這個問題的引爆點大致可以歸功於統計數據,所以讓我們先看看數字:
https://imgur.com/eN2QWqR
*註2:數據參考衛服部網站:https://goo.gl/5M9iVq,數據為1984年至2014年之總和
其中5,321人為異性戀不安全性行為中男性人數與女性人數總和;
男性4,441人、女性880人,共計5,321人。
(另外先有註2是因為作圖的時候先做了別張XD
真正寫文章的時候發現這張放前面才有個前因後果)
https://imgur.com/HGtkv9T
好好停停停停!
數據上確實是寫著男男間不安全性行為人數比異性戀人數還多呀!
賴清德那樣說,到底錯在哪裡?
https://imgur.com/aS5SqP3
(其實也沒有用到很高深的統計,因為我也不會:P)
為什麼賴清德那樣的說法是錯誤的?其實關鍵就在只看「人數」其實不準。
這樣講好了,我們先把大家做一點分類:
https://imgur.com/pK0U03Z
*註1:事實上同性戀與異性戀並不適合分開來討論,因為人的性向其實是一片光譜,
也就是大家所熟知的性別光譜。但是因為後續的數學討論需要,
所以我才把同性戀跟異性戀切開,因為數學上定義的分割(Partition)嚴格指
的是兩個集合交集為空,但聯集為整個宇集。
(本部分註的部分,若數學看不懂則可以忽略,不是重點XD)
https://imgur.com/m03QQAI
事實上,若只看人數的數字是沒有意義的。除了未知的人數真的不知道有多少人以外,
扣掉篩檢HIV結果呈現陽性者的人數以後,還必須知道「到底有多少人去篩檢?」
如果你不是很懂的話,讓我舉個例子給你看:
這是男男間不安全性行為與異性戀不安全性行為的人數:
https://imgur.com/eN2QWqR
但是,如果真實的受試者人數長成這個樣子呢?
https://imgur.com/pDFEb8Z
*註3:此處的受檢人數為假設數字,並不代表真的數字。我只是要讓你看出來,
受檢人數的多少其實才是真正影響這個統計數字的關鍵。
你問我為什麼不把真的數字寫出來,要寫我假設的數字?
當然是因為每個人去篩檢的時候,他沒事才不會問你是不是同性戀咧。
所以我們只知道到底有多少人「玩過這個篩檢」,但卻不知道這些接受篩檢
的人之中,同性戀與異性戀的占比。
從比例來看的話,不管是同性戀或者是異性戀,篩檢人數:愛滋病人數都接近2:1耶!
如果真實的篩檢數字正常這樣的話,那我就可以跟你說,愛滋病的主因跟同性戀完全
無關!從數學上來看的話,兩事件若為獨立事件,則族群數量與事件的發生成比例。
(單純就是數學上對於獨立事件的定義,也就是說兩件事情無直接關聯)
其實在生活中也不難看見這件事情。大部分的同志相較於異性戀來的更有篩檢的概念,
因此造成同性戀的受試者人數較異性戀多,這也是可以被接受的。
你說,可是我們也不知道真正各族群的篩檢人數是多少啊!
我說,就是因為不知道各族群篩檢的人數是多少,所以賴清德才無法說愛滋病的主因
是男同性戀之間危險性行為!就是因為數字並不知道,你講話要有憑有據,如果不是事實
的事,那你就不能亂說!
這時候如果你不服氣,想要幫賴神護航,那我來告訴你怎樣的數據叫做愛滋病的主因
就是男同性戀吧!
https://imgur.com/iJfCXla
或者請看下面這張圖:
https://imgur.com/iyuWM3N
如果有辦法從衛服部的數據中,證明以下的不等號成立:
https://imgur.com/eFTvAXS
那至少你就可以說愛滋病與男同性戀者有關,即男同性戀為愛滋病的主因之一!
呼~寫到這裡本來想繼續用數學寫下去的,不過我覺得這樣解釋應該大部分的人都懂
了,如果還想了解更深入者,歡迎Google貝氏定理(Bayes' Theorem)。
接著我想寫一些不論是新聞媒體或是院長本人都應該理解的事情:
事實:在HIV+患者當中,男同性戀佔的比例較高。 (這是客觀的事實)
推論:HIV+的主因是男同性戀之間的不安全性行為。 (這是主觀的推論)
從事實→推論其實過程沒有那麼簡單,並且此推論必須要負嚴格的舉證責任,
也就是你必須證明。(上面提過了,現有的數據並不構成此推論)
至於院長道不道歉我也無所謂了,洋洋灑灑熬夜寫了這麼多也只是希望大家
可以少點對同志的污名。一路從去年十月開始的婚姻平權小蜜蜂走來,
這條路並不好走,除了婚權以外,我們要的更是平權。
身為一個說書的,也總是希望台下的呆瓜們可以聽懂我想表達什麼,
從減少歧視、反霸凌到反汙名化,讓這個世界更美好。
希望大家有看懂,也誠懇的請版上高手,如果有錯麻煩鞭大力一點,懇請不吝指教!
萊恩
作者: pipi21th (阿丹)   2017-09-26 06:39:00
真是用心,幫你推一個
作者: peter080808 (peter)   2017-09-26 07:30:00
講了半天 還是"愛滋黑數"這爛招
作者: scelerisque (scelerisque)   2017-09-26 07:31:00
推分析
作者: peter080808 (peter)   2017-09-26 07:32:00
得愛滋遲不篩檢 早晚會發病的 到最後還是會回到統計中就算有潛伏期 但也只是延後而已 對新增病率的統計影像不大台灣不是第三世界國家醫療覆蓋率低落不可能你愛滋發病 還不會進入醫療體系中不被統計到是有少部分人帶原hiv不吃藥也永遠不會發病,那是少數有特殊基因的歐裔東亞裔哦 不吃藥控制就等發病吧
作者: arcelab (烏梨)   2017-09-26 07:42:00
我們可不可以因為發生家暴的家庭多數是異性戀,所以宣稱異性戀成家是導致家暴的主因呢?答案肯定是不行的。 任何抽樣統計要推論到全體,都有以管窺豹之嫌。
作者: peter080808 (peter)   2017-09-26 07:44:00
你試圖用統計交集創造一個偽論"同志高是同志篩檢人多"但卻忘了愛滋不是真的"小感冒" 沒補助給帶原者吃藥早晚會發病 還是會被醫療機構紀錄到愛滋黑數只是解釋了為何有新增病率暴增的原因黑數在被檢測出來前依然持續危險性行為 造成新病歷但黑數在台灣早晚會回到總統計中 對族群病率推估影響不大事實上 如果假設黑數是造成新增病歷的主因 那新增病歷一直成長的男同 才可能是黑數最高的族群我是預設男同確定帶原後 就不會做危險性行為了沒有異性戀有大量黑數 但新增病歷卻下降的可能用國高中的統計 就想推翻防疫專家統計的結論 ..........唉
作者: Sinreigensou (神靈幻想)   2017-09-26 08:13:00
推噓文的那位,黑數在醫療覆蓋率高的狀況下不合理除非每個發病都不給醫院治療,關在家等死才有黑數
作者: peter080808 (peter)   2017-09-26 08:17:00
是會有黑數啦 但黑數在台灣對病率推算引響不大,因為遲早會被統計到探討"黑數" 主要是探討黑數造成新病歷但新病歷最多的是哪個族群我不講了
作者: wiiwiinccu (wiiwii)   2017-09-26 09:03:00
母體數跟抽樣數應該不同喔覺得原po的邏輯滿好的,推的都是符合統計學的解釋,其實就社會公開發言這件事而言,本就該有多少證據說多少話吧
作者: uka123ily (NUNCA MAS)   2017-09-26 09:42:00
目前黑數影響不大?黑人問號更正一下,統計沒有事實喔。你說的那是統計「分析」或「總結」。
作者: ksng1092 (ron)   2017-09-26 09:55:00
統計有趣的地方是同一筆資料在不同人手上可以得到很不一樣的結論XD
作者: prokey (小矮)   2017-09-26 12:17:00
作者: sorawang   2017-09-26 12:58:00
如果都是用真的'統計學'來解釋一份數據,結果應該不會相差太遠,怕就是有人看百分比率,完全沒有拿數據跑test就直接下結論,而且還是下因果推論XDD
作者: foolwind (廢人...廢樣...)   2017-09-26 19:06:00
用藥全額補助,白癡才當黑數,講三小黑數前,先用腦袋想想
作者: lili300 (膝蓋中了一箭)   2017-09-26 19:24:00
去看下面les大那篇吧 黑數什麼的別再說了 根本站不住腳
作者: wowowg (Isn't it?)   2017-09-26 21:46:00
不要再給我看到 黑數 這種爛理由
作者: jengjye (建)   2017-09-26 21:49:00
推樓上...本篇文的壓縮率一定超高的...

Links booklink

Contact Us: admin [ a t ] ucptt.com