Re: [閒聊] 機率與統計

作者: assss49 (帥為)   2022-08-01 15:12:15
※ 引述《iampig951753 (李白)》之銘言:
: 其實他說的完全沒錯
: 公正硬幣來說
: 是有可能出現十次正或是十次反的
: 機率差不多千分之一
: 機率這種東西樣本越大
: 越接近原本估算的百分比
: 所以才會有所謂的信賴區間
: 你做一千次去計算實際機率
: 可能不會是千分之一
: 但是丟一億次
: 實際機率肯定會非常非常貼近千分之一
: 只要假設機率是對的
: 意思就是說 當你實驗的次數越多
: 機率只會往準確的時候部分修正
: 因為事件總會發生
: 不可能永遠都沒發生
: 所以樣本每增加一個
: 碰到事件的可能也會增加
: 夜路走多了會碰到鬼這句話
: 就是在講述機率的真理
: 機率不是靠賽 是科學
: 不要以為1%就只是1%
: 當你打算做一萬次
: 對你來說發生一次的可能性早就不是1%了
: 之前我就有提過了 獨立事件的誤區
: 就是忘記把機率加起來算
: 如果有個實驗只有1%會死
: 你做300次還活著就給你一億
: 跟另一個實驗50%會死但是做一次沒死就給一億
: 你選哪一個?
: 獨立機率的謬論支持者的邏輯來說
: 他應該選1%的
: 因為1%小於50% 每次都是獨立的 懂?
: 這次1%下次當然也是1%
: 那鬼才選死亡率大50倍的
: 笑死 幼稚園白讀
你的敘述讓人聽起來就像是:
「有一個神秘的科學神明,當有人連續躑硬幣10次都出現正面,他就會改變硬幣的結構、
重力場等等,讓硬幣出現的反面的機率上升,直到硬幣正反面出現的機率會歸到1/2。」
我希望你是敘述能力欠佳所以表達有點偏誤,
所謂的大數法則、做無窮次的試驗機率會回歸,
這背後的原因也是因為你做得試驗越多,
根據統計結果「預估的機率p」
接近「真實機率P」的機率也會越高,
(而事實上大部分的問題我們並不知道真實機率P是多少)
而所謂的95%信賴區間,
意思是這個測驗中「真實機率P」有95%的機率會落在這個區間內,
當樣本數提高 變異數 s^2 = p*q/n 則會降低,
(架設抽樣至常態母體的話)
其中p=預估的機率 、 q=1-p
所以信賴區間會越來越窄,
而lim(n-> infinity)s ^2 =0 ,
所以當lim(n-> infinity)信賴區間的上界等於下界,
才會有你所謂的「回歸」的現象發生,
(大數法則不嚴謹的解釋)
而不是什麼超自然的科學神明,
高中的數學就可以解答了。
但必須說實務上很多事件其實是相依事件,甚至很多時候預估就有bias…
(即便是電腦抽卡也是,記憶體之間會互相影響,時間種子等等因素也會影響機率)
不過為了處理上方便還是假設為獨立事件,而且大部分的系統宏觀上來看也可以以獨
立事件來分析,但微觀或是小樣本的時候會有很大的偏誤。這其中可以牽涉到數理統計、
測度、甚至泛函,我也是懵懵懂懂。
乾一直打錯字,編輯好多次。
作者: k960608 (霧羽‧浪沙)   2022-08-01 15:13:00
神無論如何都會把世界修正成1%的樣子
作者: storyo11413 (小便)   2022-08-01 15:17:00
當你不是天選之人,你抽到的樣本最終會回歸大眾不管你是首抽中獎還是開局百抽百敗的例子
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:24:00
其實你認真看原原 Po 的敘述,我是覺得他已經拿很直觀的比喻來解釋統計機率跟古典機率的差異了。無奈的是要拿一個大眾能聽懂的陳述「統計機率的性質」這件事,其實我覺得沒這麼容易XD
作者: arrenwu (鍵盤的戰鬼)   2022-08-01 15:27:00
樓上不妨用數學語言發篇文章? 希洽這裡理工背景的很多啊就算沒有很多 也不至於沒一個人看得懂吧
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:28:00
無奈的是我統計機率沒有強到自認能不做功課發文== 只敢推文發表看法XD
作者: smart0eddie (smart0eddie)   2022-08-01 15:28:00
這人就釣魚的 不用認真理他
作者: shifa (西法)   2022-08-01 15:30:00
1%跟50%的實驗那個不算是純然的機率問題,而是有期望值考量的選擇問題。
作者: arrenwu (鍵盤的戰鬼)   2022-08-01 15:30:00
如果你沒辦法用數學語言描述 那你怎麼確信你知道他在講什麼?
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:33:00
但我認知中原原 Po 的文意是想講那三百次「實驗」的 1%的表定理想機率,在後面次數的「實驗」並不能保證能跟第一次的「實驗」一樣公正,可能更高也可能更低,假使有「類似累計誤差的偏誤」的機制存在,在 worse case 的情況下,在最後幾次實驗失敗的統計機率,反而比只能做一次 50% 的實驗還高。
作者: arrenwu (鍵盤的戰鬼)   2022-08-01 15:35:00
如果實驗不公正,那又怎麼知道下一次實驗結果的機率?
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:35:00
@arrenwu 我是從原原 Po 強調「走多夜路碰到鬼」以及很強調「實驗」的句子認文意的啦,不然要寫符號還要檢查到不被噓真的很累...QQ
作者: uranus013 (Mara)   2022-08-01 15:38:00
夏蟲不可語冰 並不是能力不足 而是他的世界真的長這樣我是覺得到此為止就好
作者: lazarus1121 (...)   2022-08-01 15:39:00
用數學的語言就是引入極限的概念吧
作者: shifa (西法)   2022-08-01 15:40:00
其實這篇就講出來點來了。但是人對於機率的直覺往往會導致誤判。恐怖的是對機率的誤判往往會有一套看似完整的邏輯。
作者: LLuthor (LLuthor)   2022-08-01 15:40:00
回到芽依的問題,她10次反面,之後會有比較多的正面。這
作者: lazarus1121 (...)   2022-08-01 15:41:00
只要扯到極限,高中以前學的東西都要丟掉了
作者: LLuthor (LLuthor)   2022-08-01 15:42:00
其實機率有個很基本但重要的定律,叫做貝式定理。一般人常常就是條件機率跟一般的機率搞混。
作者: smart0eddie (smart0eddie)   2022-08-01 15:43:00
芽衣純粹智障
作者: guogu   2022-08-01 15:43:00
攻殺小 機率不公正我們就什麼屁都不用討論了
作者: smart0eddie (smart0eddie)   2022-08-01 15:44:00
而且就算她搞懂硬幣機率她FX照樣會輸到下海
作者: lazarus1121 (...)   2022-08-01 15:47:00
有限的例子討論無限的理論,可以直接略過了
作者: Gjerry   2022-08-01 15:50:00
看你是 Frequentism 還是 Bayesian statistics 的角度看事情。前者會說出現這樣的情形是因為試驗做得不夠多,後者會說硬幣不是公平硬幣。
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:53:00
推樓上
作者: guogu   2022-08-01 15:55:00
那個i莎咪挖溝的文章一開頭就說是公正硬幣了==而且你當硬幣不公正 更應該去壓正面而不是反面
作者: cybermeow (我有一隻貓)   2022-08-01 16:00:00
硬幣不公正當然是算posterior做posterior sampling啊
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 16:02:00
有 我剛剛認真再看一遍硬幣公正的那段論述 為什麼機率會變成千分之一== 補噓ㄌ
作者: Gjerry   2022-08-01 16:03:00
另外連續的擲硬幣 frequentism 會用 geometric distribution (幾何分佈) 來描述整個試驗,geometric distribution是 memoryless (無記憶性) 的也就是某事件發生與等待時間無關。
作者: xxxg00w0 (寒夜)   2022-08-01 16:05:00
ㄟ幹 不是 現在不是暑假嗎?還好我碩士畢業多年了XD一瞬間發現自己疑似走錯版
作者: Gjerry   2022-08-01 16:06:00
如果相信是要用貝氏機率解釋,不斷地觀測到某一個事件發生,會對下一次發生該事件的信心提升,確實應該壓正面而不是反面。

Links booklink

Contact Us: admin [ a t ] ucptt.com