Re: [問卦] 為什麼統計學這種蓋棺論定的事也能吵

作者: kh749 (ReturnTo)   2023-11-20 16:51:37
※ 引述《SRadiant (Radiant)》之銘言:
: https://i.imgur.com/5L8v7Ta.jpg
: 我是真的不知道這機構算不算中立
: 咕狗翻譯是說
: https://i.imgur.com/XXshtth.jpg
: 需要領先 6 個百分點或更多,我們才能確信領先不僅僅是抽樣誤差的結果。
難得統計在這次扮演這麼重要的角色,
我作為這個圈子的nobody, 感覺也應該盡點心力
p是支持率
Var(p)大約是p(1-p)/n, 開根號再乘以1.96就是抽樣誤差
為求讓大家都看得懂,
一般把p=0.5求粗估值, (0.5*0.5和0.4*0.6也差不多).
當n=1068時, 根號(var(p))*1.96 = 3%
比較兩位候選人得票率p1,p2
Var(p1-p2) = Var(p1)+Var(p2) - 2*r*根號(var(p1)*var(p2))
如果粗估p1=p2=p, 那麼var(p1)=var(p2)
var(p1-p2) = 2*var(p) - 2*r*var(p)
r是大家高中都學過的相關係數-1<r<1
(1)當r=-1時,
也就是假設一個人投給國民黨的人就不投給民進黨, 完全負相關
var(p1-p2)=4*var(p), 開根號之後發現誤差範圍是原本的2倍
這個假設有一個小缺陷就是一個人還有第三種選擇,
那就是投票日當天選擇出去玩, 不投票,
所以真正的 r = -0.5, 中度負相關
var(p1-p2) = 3*var(p), 開根號之後是原本的1.75倍, 也差不多2倍了
所以文章的內容大致是正確的.
(2)現在p1=柯侯,p2=侯柯
這兩個數字並非是負相關, 反而是高度正相關,
投給柯侯的人有很高的機會也投給侯柯
如果r=0.8
var(p1-p2) = 0.4*(var(p)), 開根號後是原本的0.65倍, 不但沒增加, 還縮小了
當n=1068時, 這個誤差是3%*0.65 = 2%左右 <-不是國民黨說的5.X%
這個含意是:
"如果柯侯和侯柯的正相關性高達0.8,
那麼民調之中柯侯只要領先侯柯超過2%,
統計上就代表柯侯顯著勝過侯柯"
備註:
統計學博士費鴻泰還是有水平的,
雖然他上節目說的我沒怎麼聽懂,
但是他總歸答對了這個問題
我不曉得簽上名的兩位政大和文大兩位教授怎麼看這個問題?

Links booklink

Contact Us: admin [ a t ] ucptt.com