首先 抽樣誤差是在統計學上本來就會有的限制
只是用機率的形式來展現
拿抽樣誤差3%6%來說要讓幾% 根本就在亂用
到底指的是民調數字讓3%?讓抽樣誤差?
還是只要沒有統計上的顯著差異就讓?
講的不清不楚
更別說兩黨在比的東西不一樣吵的東西也不一樣
一邊比差距的差距,一邊比柯侯-侯柯
一個是相對數字一個是絕對數字
兩邊所謂的3%6%指的根本就不是同一件事
到底在吵什麼,也完全是看不懂
假設有效樣本數1068 在95%信心水準下
誤差就是+-3%,舉例來說就是100的正負3
但這只能用在計算單一統計值的時候
藍白是把一個民調裡面的兩個統計值拿來相比
下面就直接節錄一些臉書上教授寫的文
支持率的差異不一定要超過兩倍的抽樣誤差(柯文哲說的6%)才會達到統計顯著
第一因為3%是保守最大值的估計,實際上的「抽樣誤差」通常會比3%小。
再者信賴區間有重疊也不代表沒有達到統計顯著
第二,兩個人的對比支持率是同一個民調做出來的,不是獨立樣本,不能忽略相關性。
———————————————————————
以下是同一民調不同問題得出的支持度應該怎麼比較:
https://i.imgur.com/4sM2ya6.jpg
以匯流為例,樣本數n = 2046,(1) 柯侯48.3%對比(2)賴蕭 39.2%,所以(1)-(2) = (3)
兩個統計量的差異的標準誤差是這樣算的 https://i.imgur.com/50DV1iY.jpg
sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )
=
sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)
= 0.021
因為柯侯: 賴蕭 是在同一個問題問的,支持柯侯就不會支持賴蕭 (互斥)
所以這兩個支持率的相關性是負數,這就是為什麼公式後面為什麼會多出2*p1*p2。
所以柯侯對比賴蕭的支持率要超過1.96*2.1% = 4.1%,才有統計上的差異。
同樣的方式可以算出(4)-(5)=(6),兩個統計量的差距的標準誤差是0.0207。
所以侯柯對比賴蕭的支持率也是超過1.96*2.07% = 4.1%,才有統計上的差異。
但是如果要直接比較柯侯對侯柯的支持度,就得考量到這是兩個不同問題得到的
而且支持柯侯的人也會比較傾向侯柯,所以相關性為正。
而(1)-(4)的標準誤差會長得像這樣
sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )
=
sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)
= ???
v 是柯侯跟侯柯在兩個問題的共變異數,得用原始資料去估計。
沒有v就算不下去
也就是說,不論是(3)-(6)=(7)還是(1)-(4)=(8)只要沒有原始數據
都算不出來應該怎麼決定有統計意義的差距。差距的誤差就不是抽樣誤差。
結論:
再怎麼說 藍白合民調比拼絕對不是拿兩個數字來相減然後說
喔你看在6%內然後另一邊說才不是明明是3%
這是需要民調專家學者去運算的
都已經找來兩個專業的來當裁判
原始數據都在這些人手上
明明是一翻兩瞪眼的東西結果演成這樣
所以我也看不懂朱立倫記者會到底在說什麼
至於柯說什麼3% 純粹是以為誤差值是固定3%