林定香老師書中的分層抽樣例題:
從美國四年制的大專院校,入學人數與師資大小的名單中,想估計平均的入學率
(在1986-1987的學年)。因為私立院校多半比公立院校小,所以以此來分層。
儘管資料中有大專院校的型態編碼,但是名單中並沒有各校的入學資料。
因此,可以很快獲得大專院要的型態(公立或私立),但是入學資料就很難處理。
一組大專院校型態以10取1選取的系統樣本來蒐集資訊。
結果如下:
私立(n'_1)=84
公立(n'_2)=57
全部(n')=141
以下是11所私立院校和12所公立院校的次樣本入學資料和師資大小。
(師資資料將在之後使用。)請估計美國大專院校在1986-1987年的平均入學人數。
私立,n1=11 公立,n2=12
入學 師資 入學 師資
1618 122 7332 452 a'_1=84/141=0.6
1140 88 2356 131 a'_2=57/141=0.4
1000 65 21879 996 y_bar_1=(1681+1140+...+1050)/11=1681
1225 55 935 50 y_bar_2=(7332+2356+...+5380)/12=5853
791 79 1293 106 (s_1)^2=[sum(yi-1681)^2]/10=3143529
1600 79 5894 326 (s_2)^2=[sum(yi-5853)^2]/11=34257609
746 40 8500 506
1701 75 6491 371
701 32 781 108
6918 428 7255 298
1050 110 2136 128
5380 280
平均入學人數(y'_bar)=0.6*1681+0.4*5853=3349.8
**林定香老師的計算是假設n'大到足以忽略 a'_i/n' 的情況,所以變異數估計值會變成
sum{a_i'^2*s_i^2/n_i+a'_i*(y_bar_i-y'_bar)^2/n'}
平均入學人數變異數=0.6*0.6*3143529/11+0.4*0.4*34257609/12
+[0.6*(1681+3349.8)^2+0.4*(5853-3349.8)^2]/141
=545708.05+29626.52
=575334.57
PS:
但是補習班老師的資訊是不忽略 a'_i/n'
所以整個變異數的估計有很大的出入,請問該依照哪位的計算比較恰當?
由於數學不意表達,若造成大大觀看上有不方便,請見諒。