※ 引述《alex8725 (近鉄バファローズ魂不滅)》之銘言:
: 其實這個解讀是錯的
: 正確的解讀是
: 「多次抽樣的情況下,約有95%的抽樣結果,其正負兩個標準差的信賴區間有包含
: 真值」
這個是正確的信賴區間解讀方式沒有問題
: 你問我這兩個有什麼差?我也不知道
: 但我以前老師說絕對不能這樣解讀
: 好像是因為p-hat跟p都是真值沒有機率可言吧?
這邊就稍微有點問題了,
p是一個未知母體參數所以是當成常數沒有問題。
但p_hat是p的一個估計量,也是一個統計量,
所以p_hat仍為一個隨機變數,
那既然是一個隨機變數就一定有一個機率分布,
所以信賴區間就是透過p_hat加減乘除一些東西後再造出一個統計量,
然後讓這個統計量符合某些我們已知的分布,之後再移項,
才有辦法造出統計學課本上看到的信賴區間。
那信賴區間要怎麼解讀呢?
這個問題可以參考
Introduction to Mathematical Statistics by Hogg, McKean, and Craig.
一書內所提到的解釋方式
https://imgur.com/jyBgWHC.jpg
簡單來說就是把每次抽樣、造區間都當成一次伯努力試驗,
在抽樣之前我們當然不知道抽樣後所算出來的區間到底有沒有包含p,
也就是抽樣前的區間具有隨機性,
所以在抽樣之前我們就可以說「我們抽樣前所造出來的區間包含p的機率為(1-α)」,
這邊抽樣前所造出來的區間是指統計學課本上所看到的那些公式,
就如同投擲一枚公正的硬幣,
我們在投擲硬幣前不可能知道投擲後的硬幣會出現正面還是反面,
投擲前硬幣出現的結果具有隨機性,
我們在投擲前就可以說出現正面的機率為0.5,
但一旦投擲後不是出現正面就是反面,
所以我們不會說投擲後出現正面的機率為0.5。
透過信賴區間的定義得知以上敘述是沒問題的,
即抽樣前我們造出來的區間(兩個統計量)包含p的機率為(1-α)。
這邊要注意的是我們前面提到統計量仍為一個隨機變數,
所以在抽樣之前要算機率是沒有問題的。
前面又提到我們把每次抽樣、造區間當成一次伯努力試驗,
所以重複抽樣、造區間n次可以視為服從二項分布的隨機變數,
而二項分布的期望值為 n*p (此處的p為二項分布的參數,非我們要估計的p),
因此信賴區間可以解釋成「抽樣100次,約有 100*(1-α) 個區間包含真正的母體參數p」
又或者是「我們有 (1-α)*100% 的信心說真正的p落在這個區間內」。