Re: [討論] 民眾黨內參民調 9月9日-9月10日

作者: NewYAWARA (朝霞之前奏)   2023-09-13 10:42:44
推 laoabo: 市話加權前侯贏5%,加權後落後3%? 223.137.84.233 09/13 08:50
推 laoabo: 然後我們一般不是都說要做到最少1000多份 223.137.84.233 09/13 08:56
→ laoabo: ,可是市話700份拿手機300份來湊,這樣不 223.137.84.233 09/13 08:56
→ laoabo: 是等同市話手機都分別不達標,然後加權模 223.137.84.233 09/13 08:56
→ laoabo: 式也怪怪,怎麼會加權前+5加權後-3,是不 223.137.84.233 09/13 08:56
→ laoabo: 是在母體上沒有照人口分佈直接用加權和手 223.137.84.233 09/13 08:56
→ laoabo: 機去平衡?好想知道這是誰設計還是外包給 223.137.84.233 09/13 08:56
→ laoabo: 誰做的?不知道有沒有民調熟手幫忙解釋 223.137.84.233 09/13 08:56
做民調簡單一個概念,就是希望要盡可能滿足「隨機性」,
也就是說任何合格選民都有可能被抽樣到,
在這樣的前提下,做1068份的成功樣本,
依照統計原理,可以說它在95%的信心區間內,
可以與母體真正的結果相距正負3%內。
用白話說就是抽100次,會有95次至少落在這個正負3%區間內。
因此既然關鍵是滿足隨機性,
無論是用市話做、用手機做、用網路做,
只要有辦法做到這一點,那用什麼做都沒差,
這就是為什麼它可以直接把市話700加上手機300來湊,
而不是分別都做到1068份以上。
大家通常會有問題的是,那為什麼要做這樣的混合?
主要也是大家都清楚的,市話比例越來越低,
幾乎是人手一支手機,所以有可能只有市話來調查,
會找不到那種只用手機的族群。
可是只用手機會不會有問題,自然也是有它的硬傷,
除了成本比較高之外,
一來手機號碼無法判別受訪者所在區域,
所以一開始在抽取樣本階段時,在「戶籍地」這塊偏差就比較大;
二來因為要滿足「隨機性」,但大家用手機的習慣不同,
有可能願意接陌生人手機,和不願意接的人,
投票行為會有顯著差異,這樣就等於只會問到前者的意見,
同樣也會有所偏差。
用市話最大的問題當然是涵括性較差,
但除非我們很明確知道說,家裡有裝市話、與家裡沒裝市話的族群,
這兩者的投票行為可能也有很大差異的話,
那麼市話還是有一定參考價值。
例如市話只能找到40%的人群,
可是如果這40%的人群,和整體100%的人群特質無甚差異的話,
就還是有一定的推論價值。
而在做市話的時候,會盡量做類似「戶中抽樣」的舉動,
也就是不單只是問接到電話的那個人,
避免說家中常接電話的人的意向,與其他家人會有明顯差別,
所以會用電話號碼尾數來決定要訪問家中哪個合格選民。
只是市話也確實找到年輕人的比例明顯偏低,
所以最後還需要做加權矯正,這個動作是無論用哪種調查方法,
都是會做這樣的加權,以讓樣本的結構,符合母體的結構。
以這次調查來說,沒意外也是先把市話及手機的成功樣本先統合,
(整體樣本做統合,精細一點就是也另外拆分去看,
但拆分完後,個別的樣本數又變太少,誤差區間過大,
我是覺得意義沒那麼大)
先檢定性別、年齡、戶籍地、教育程度有沒有符合母體結構,
通常很難一開始就會符合,所以都會加權處理。
多重加權的目的,在於加權一次之後,
可能年齡符合母體比例了,但是戶籍地或教育程度不符合,
那就繼續加權,直到年齡、性別、戶籍地、教育程度在統計檢定上,
都與母體無顯著差異為止,這算是正常操作,
倒不是有意說要特別偏坦誰。
也因為有了所謂的加權,所以當樣本一開始結構和母體差很多時,
例如年輕人應該佔母體30%,可是樣本只有15%時,
那加權完後,樣本裡的年輕人意見就會變成兩倍重要,
(先不管多重加權後,真正的權值應該不是兩倍這件事)
所以類似柯文哲這種年輕人支持率較高的參選人,
就容易出現加權前落後,加權後反超的現象。
至於是不是要做市話混手機,當然學界都各有看法,
主流看法是混一下比較好,比例也大概是抓70-30,
但這也沒有嚴格的學理依據說是要這樣混。
而在手機沒辦法克服辨識戶籍地之前,
除了總統大選這類全國性選舉外,在地方選舉幾乎不可用,
這也是手機民調的侷限之一。

Links booklink

Contact Us: admin [ a t ] ucptt.com