43
不可置信
為了方便說明,先來看一個抽三次的例子,一樣每次 10%
假定抽樣間獨立,前面是否抽中不影響後面抽中機率
也就是穩定的 10% 抽中,1-10% = 90% 沒抽中
因為是抽三次,所以可能有 4 種
沒抽中 90% x 90% x 90% = 72.9%
中 1次 10% x 90% x 90% 第一次中
+ 90% x 10% x 90% 二
+ 90% x 90% x 10% 三
= [C 3 取 1] 10%^1 x 90%^2
= 24.3%
中 2次 [C 3 取 2] 10%^2 x 90%^1 = 2.7%
中 3次 10%^3 = 0.1%
從上述可以發現到不同抽中次數的發生機率是有計算規律的
不用去考慮什麼中央極限定理就可以知道抽中幾次對應到的機率
規則上就是總抽 n 次,中 x 次,每次抽中機率 p,則發生機率為
[C n 取 x] p^x (1-p)^(n-x)
而所謂的檢定粗俗點講,就是在「假設正確」下,觀察到的樣本罕見到「不可置信」嗎?
好比前例只說我們就只抽三次,然後中了兩次,你覺得機率有點低「機率小於 10%」。
那我們就去把抽中兩次以下的機率通通加起來,看他是不是小到不可置信。
現在先把原文中的 5% 當作基準,如果機率加完後小於 5%,我們就覺得不可置信。
72.9% + 24.3% + 2.7% = 99.9%
這個數值表示高達 99.9%,表示說在「機率 10%」下,這件事還真有可能發生。
以這個案例來說,如果你問「機率大於 10%」嗎?
那就是 2.7% + 0.1% = 2.8%,會覺得「還真有可能大於 10%」,係因 2.8% < 5%
換言之,就是要注意「提問對應的算法」。
但無論如何,都跟什麼中央極限定理無關。
你可能會想問
「機率小於 10%」為啥是要去把「抽中兩次以下的機率加起來」
我就是想「抽中兩次以上的機率加起來」不可以嗎?
來看看一個例子,或許可以比較理解。
天鵝的啟示
這裡以提問「天鵝是不是都白的」作為說明案例。
我們考慮關於是不是白的兩種等價敘述
1. 所有天鵝都是白的
2. 有一隻天鵝不是白的。
這兩敘述中的任何一敘述被確認真假後,另一敘述的真假便立即得知。
來討論看看,這兩敘述分別在敘述為真的情況下,哪一敘述「比較容易確認」。
首先來看看「所有天鵝都是白的」這句話。
在這敘述為真的情況下,想要確認就要檢查全部天鵝。
一隻隻檢查,直到最後一隻天鵝檢查完,只要還剩下任何一隻,就不算結束。
然後發出,喔,天啊,真的都是白的,這樣才驗證完。
再來是第二句話「有一隻天鵝不是白的」。
一樣一隻隻,但只要檢查到發現某一隻不是白的即可停止。
很顯然的,第二個敘述相對容易被驗證為真。
由此可知,我們即便是想要知道「所有天鵝都是白的」。
也是藉由確認「有一隻天鵝不是白的」這敘述是錯誤的來得知「所有天鵝都是白的」。
當檢查到最後一隻天鵝時,也都沒有發現任何一隻不是白的,則第二個敘述錯誤,以此得
知第一個敘述正確。
在進行假設前提確認時,要以能否藉由資料否定假設,想要直接驗證假設一般是很困難的
。
在不考慮一些特殊情況下,「一般我們同意」假設相對假設外「小」很多。
換言之,「操作」否定假設以回應「主張」證明假設。
好比以前面討論抽中機率,就可能有預期外的「當機=沒抽中」這種情況。
(還是有哪家會出現當機給你算抽中的?重抽就不錯了吧??)
該怎麼推論
根據上述說明,你可能會疑惑前面抽卡說明裡「機率小於 10%」是去算抽中兩次以下的。
這其實是沒有區分「主張」與「操作」的問題。
從前面天鵝的啟示裡可以知道,主張「A 正確」則是以操作「觀察 A 不正確」回應。
「機率小於 10%」是在「操作」,也就是觀察「有多麼不正確」。
實際上該操作對應的主張是「機率大於等於 10%」
流程大概如下
主張「機率大於等於 10%」
=> 現象「高機率觀察到抽中足夠多」
=> 抽中很少代表主張錯誤 (罕見事件)
=> 計算抽中兩張以下機率 (假設前提正確下的計算)
=> 看起來「像」主張機率小於 10%
之所以會「像」是因為我們「先天知道」只有「A 與非 A」兩種情況。
好比前面天鵝的例子,你實際上不知道白天鵝以外會是啥顏色。
不會有什麼「天鵝黑到什麼程度」的觀察,壓根就不知道會不會是黃的、藍的、紅的,怎
麼會從「黑」去判斷 484
此外,在有更多資訊狀況下,我們能更明確地設定該如何去拒絕假設。
前面提及的 5%,具體而言係指「不小心把假設拒絕掉的機率」型一錯誤率 alpha。
但很多時候我們在意的可能其他,好比「假設不對,有真的拒絕假設」檢定力 beta。
如果知道各種判斷時的損益,則可以計算經濟收益矩陣。
假設正確 錯誤
拒絕假設 alpha;A beta;B
不拒絕 1-alpha;C 1-beta;D
A;B 表 機率;損益
則可以去操作最大化期望損益
A x alpha + B x beta + C x (1-alpha) + D x (1-beta)
以本抽卡案來說,就是可以考慮評估該案對未來的「社會損益」去代入 A,B,C,D。
(不過對某一造來說,可能只在乎假設正確/錯誤中某一個)
另外,beta 有的時候不知道,需要去估計評估。
考量經濟收益矩陣對於實際應用非常重要,只會問「Yes or No」會造成許多問題。
所以本案呢?
以此案來說橘子方應該是主張「機率大於等於 10%」
那操作就是計算抽 175 次中 4 次以下的機率
根據數感實驗室 https://bit.ly/3ZBWv63 計算,機率為「十萬分之 7」。
(我算好像是萬分之七啦)
即便考慮前後抽 475 次中 11 次,機率也非常之低。
我用 https://stattrek.com/online-calculator/binomial 算,機率顯示 0,應該是小
到不給算了。
若採用原文所約定的 5%,將其視為「不可置信」來說,算是拒絕該主張的。
不過我不知道具體法院有沒有約定什麼數字,或是有其他資訊之類的,無法作完整判斷。
好比說可能有約定說機率不獨立,抽中後會不中多少次之後才重置卡池之類的。
沒玩手遊,不是很確定契約怎麼寫的。
其他
從上述來說
抽卡本身就是可以用二項式分佈算
根本就不需要啥中央極限定理、抽樣次數、常態