[閒聊] 天玉里的數學基礎:均值定理

作者: oaoa0123 (ball ^ω^ ice)   2018-12-19 19:00:13
最近丁丁一直開嘴天玉里,來分享一下關於選舉章魚哥里的看法。
這篇文章〈尋找六都章魚哥:開票時,看哪個里最準?〉整理了六都的章魚哥里:
https://tinyurl.com/y8etmusu
可以發現六都之中都有一個里的投票結果與全市最大誤差落在2%之內,
而天玉里是其中準確度最高的。
這其實不是迷信,為什麼?只要從微積分的均值定理考慮就很直覺了。
我們首先做三個理想化假設:
(1) 選舉結果可以完全由藍綠分布決定
(2) 不同次選舉中每個里藍綠板塊的位移是等勢的
也就是不會有哪個里突然變得相較於全市更藍或綠
(全市藍/綠得票率-某一里藍/綠得票率=常數 for 任一場選舉)
(3) 里數足夠多使得 f(x)=第x里得票率 足夠連續
積分均值定理說明:
將函數 f(x) 以機率密度函數 p(x) 在區間 [a,b] 的加權結果為
∫(a->b) f(x)p(x)dx
其中機率密度函數 p(x) 在區間 [a,b] 上不可變號。
因為加權後的值不可能超出原本 f(x) 的值域,
所以在區間 [a,b] 上必定存在某常數 c 使得積分結果為 f(c),即
∫(a->b) f(x)p(x)dx = f(c)∫(a->b) p(x)dx
此即加權的積分均值定理。
綜上所述,我們可以用 p(x)=第x里的人口比例 加權 f(x) 計算全市得票率
全市得票率 = ∫(全部里) f(x)p(x)dx
再基於積分均值定理,存在第c里使得
全市得票率 = f(c)∫(全部里) p(x)dx
因為人口比例 p(x) 是標準化後的函數,所以
∫(全部里) p(x)dx=1
最後我們得到
全市得票率 = f(c)
也就是如果以上假設都成立,章魚哥里就一定存在!
稍微回顧我們的假設,就知道章魚哥里的預測準確度要求人口政治結構的穩定性。
人口移動越頻繁,公民投票行為越不固定,章魚哥里就越不準確。
所以在三咖督之下,天玉里的誤差較以往來得大也是很正常的。
最後附上最新的天玉里最大得票率誤差結果,其實還是挺準確的不是嗎?
2008 總統大選:0.07%
2010 五都市長:0.54%
2012 總統大選:0.46%
2014 六都市長:0.15%
2016 總統大選:0.11%
2018 六都市長:1.20%
作者: shinny1206 (shinny)   2018-12-19 19:03:00
不管啦 天玉里誰贏誰就是台北市長啦
作者: saiocun (工程男兒)   2018-12-19 19:05:00
理工宅你好
作者: Xras (想不出來)   2018-12-19 19:06:00
理工宅你好
作者: NAGI (阿魯馬其頓)   2018-12-19 19:07:00
作者: cjoe (TeA)   2018-12-19 19:08:00
投票是離散型資料吧推推
作者: deju (Go Let's go)   2018-12-19 19:09:00
其實是統計宅 天玉里其實就是理想的樣本 這樣
作者: PeterHenson (尋找布宜諾斯艾利斯)   2018-12-19 19:21:00
丁丁相信樣本可信度>母體 他真的是政治系教授嗎
作者: greg7575 (顧家)   2018-12-19 19:21:00
找400個人,一定會有兩個人同天生日啊
作者: maxgopon   2018-12-19 19:21:00
作者: KyleSeager (Ready for KyleSeager)   2018-12-19 19:24:00
他是政治系教授,但應該不是走量化
作者: Timothy0225 (Knight in shining armor)   2018-12-19 20:08:00
里不是連續函數吧
作者: oaoa0123 (ball ^ω^ ice)   2018-12-19 20:11:00
在假設(3)已經做了連續化的校正了
作者: skyringcha   2018-12-19 20:22:00
以前只有藍綠才準啦!
作者: nakayamayyt (中山)   2018-12-19 20:30:00
就抽樣統計來看 這次還是很準 只是丁丁是北七把樣本直接等於母體
作者: icepet0015 (請別說我宅謝謝)   2018-12-19 20:32:00
如果章魚哥里一定準,投票幹嘛?
作者: Zcould (夜火千影)   2018-12-19 21:27:00
對丁守中特別不準,因為他是士林北投選區立委他在天母地區的得票率過去就高於他平均得票率

Links booklink

Contact Us: admin [ a t ] ucptt.com