Re: [討論] 常見統計謬誤

作者: Django (Cython)   2014-07-10 23:10:51
首先必須說,這些東西很難說有標準答案,可能好幾個說法都說的通。
重要的是思考的過程。
: (1) 某某研究指出,美國加州的肺結核患者比例比其他州份為高。
這第一個例子可能就讓人覺得沒頭沒尾,莫名其妙。
加州的肺結核患者比例比其他州份為高,所以咧....?要表達什麼?
可是,有些新聞就是類似這種寫法。
寫這句話,真的完全沒有要傳達或是偷渡什麼訊息?那你寫了幹嘛?
是不是有些人看完之後就會自己腦補說「喔所以住在加州比較容易得肺結核」
(然後就算你去抗議說新聞造謠他們也可以名正言順的推掉,因為他們真的沒有寫啊)
要不被偷渡思想,還是得靠自己。
回到原題,那我們修改一下命題吧
美國加州的肺結核患者比例比其他州份為高,所以住在加州比較容易得肺結核
這句話對不對?
首先,必須先判斷加州的肺結核患者比例和其他州是不是有顯著差異。
因為本來肺結核就一定有些州比較多有些州比較低,可能只是隨機分布然後加州剛好
比較高。
(類似的笑話:某校長表示本校有50%學生成績低於平均,令人憂心...)
再來,假設加州的肺結核患者的確顯著的比較多,那也不一定代表題目的因果關係成立。
假如要讓這個說法有說服力一點,那應該要試著找出一些已知會造成肺結核的原因,
然後看加州有沒有這個因子。在還沒找到以前,這最多就只是一個猜想。
最後,這其實是倒果為因的例子,因為加州空氣比較乾淨,所以肺結核患者才會移居
加州....
: (2) 某某研究發現,腳掌較大的小孩比較聰明。
其實就是年紀比較大的小孩腳掌比較大,然後年紀大的小孩比較聰明些。
(七歲比一歲聰明不奇怪吧?)
不過,原本的研究可是說「腳掌較大的人比較聰明」唷。
這個用詞又更令人迷惑....
: (3) 某某研究驚爆!長期吸煙人士患帕金森氏症的比例較非吸煙人士為低!
長期吸煙人士整體而言壽命較短,所以活不到帕金森氏症發病的時候。
所以坦白說,這個可以算是間接的因果關係,但是漏掉了中間的那一個環節。
長期吸煙
作者: lamda (鋼琴加吉他)   2014-07-10 23:13:00
看統計數據的時候得要特別小心 其實不只是統記數據應該說被扭曲的數據都有欺騙的空間先不論有無造假 光錯誤引用就有可能造成誤導
作者: yommy1108 (chiakila)   2014-07-10 23:18:00
這話題很有意義
作者: hgfx123 (泥沼浮花)   2014-07-10 23:40:00
推薦 邏輯即戰力、問對問題,找答案 這兩本書
作者: timshan (仲軒)   2014-07-10 23:44:00
第一個例子可能有很多種解釋,因為該例子只提供盛行率所以你可能是新發個案比其他州要多,也可能治療的情況比較差,當然前面推文有人提到這些人也可是發病後才移居的外來人口。
作者: chx64 (雪人)   2014-07-10 23:46:00
...這跟統計謬誤都無關阿 全都是邏輯謬誤阿 或滑坡謬誤統計你可以稍微分為統計前、中、後三個部分去探討不同時期有不同的地方不同的手段去"做手腳"目的只有一個 最終結果能夠輔助自己的論述期望 END總之我想說的是雖然錯誤的因果關係被歸類在統計誤用但是別忽略了要能夠量化為前提
作者: timshan (仲軒)   2014-07-10 23:52:00
他這裡舉出的範例都是能夠量化研究的類型..
作者: uka123ily (NUNCA MAS)   2014-07-10 23:52:00
滑坡謬誤跟這個有何關係?
作者: timshan (仲軒)   2014-07-10 23:53:00
不知道。
作者: uka123ily (NUNCA MAS)   2014-07-10 23:54:00
沒有類比其他類型,單一事件因果推論好像不能構成吧==
作者: Django (Cython)   2014-07-10 23:54:00
這裡面有哪些是滑坡謬誤?
作者: timshan (仲軒)   2014-07-10 23:56:00
不過比較需要被大眾知道的,我想代表性的問題,可比較性的問題,還有過度推論可能會是比較重要的部分。
作者: chx64 (雪人)   2014-07-10 23:57:00
很多都滑坡謬誤阿 隨便看ㄧ個 3就是阿別忘了 不恰當的問題也是歸類於統計誤用
作者: timshan (仲軒)   2014-07-10 23:58:00
3最好是滑坡謬誤XDDDD
作者: chx64 (雪人)   2014-07-10 23:58:00
其實沒關係啦 我的重點只是想告訴你在"量化的過程"
作者: timshan (仲軒)   2014-07-11 00:00:00
控制母群體為樣本數→請問這是啥?
作者: Django (Cython)   2014-07-11 00:01:00
3是真的有間接因果關係啊,哪是滑坡謬誤
作者: chx64 (雪人)   2014-07-11 00:02:00
長期吸煙=>壽命短=>患帕金森氏症比例低 沒滑坡?
作者: uka123ily (NUNCA MAS)   2014-07-11 00:02:00
我也不懂,統計沒這樣教過,書也沒寫。
作者: Django (Cython)   2014-07-11 00:03:00
問題是這是的確成立的啊=.=
作者: uka123ily (NUNCA MAS)   2014-07-11 00:03:00
滑坡是不同事件的類比,不是探討單一事件==
作者: chx64 (雪人)   2014-07-11 00:03:00
怎麼會成立? 那不然統計幹麼搞個信賴區間?
作者: timshan (仲軒)   2014-07-11 00:04:00
滑坡謬論是推論因果關係只是可能而非必然...
作者: chx64 (雪人)   2014-07-11 00:04:00
那三個都是不同事件阿 有事嘛?
作者: timshan (仲軒)   2014-07-11 00:05:00
但這個案例是你控制住年齡,你盛行率的差異就完全消失嚕..
作者: chx64 (雪人)   2014-07-11 00:06:00
所以我說過了阿 你得要有量化為前提才能產生統計誤用 沒錯阿
作者: timshan (仲軒)   2014-07-11 00:06:00
三的案例很明顯量化了阿...
作者: uka123ily (NUNCA MAS)   2014-07-11 00:06:00
我的意思是他討論三個變數觀察的的因果關係為何。但是他得將因果關係形式邏輯套用才成立。那個例子是討論中介變數,怎麼會是套用因果關係?
作者: lyu0001 (鄉民1號)   2014-07-11 00:41:00
垃圾等級的研究,統計也沒意義
作者: timshan (仲軒)   2014-07-11 00:46:00
喔。
作者: lamda (鋼琴加吉他)   2014-07-11 07:35:00
深入討論可左轉統計板...XD Statistics
作者: mnopq (Could you let me win?)   2014-07-11 09:16:00

Links booklink

Contact Us: admin [ a t ] ucptt.com