Re: [問題] 模擬考和學測 參考試卷

作者: vasily0908 (農化王炳忠)   2018-01-01 23:51:12
※ 引述《purin3 (進化成胖可丁了)》之銘言:
: 直接用統計結果來顯示 網路上有幾份最後一次北模VS學測成績的比較表
: 用EXCEL下去跑迴歸曲線 順便計算幾個基本的統計量關係
: 1、預測準確程度:第三次北模>第二次北模>第一次北模(以前北模有三次)
: (這個滿好理解的,範圍比較大、時間比較晚都會比較準確)
: 2、最後一次北模(A)與學測成績(B)差異
: (1)平均來說,B-A=1.4,也就是學測會比最後一次北模高一些。
: (2)但這與你所在的級分位置有關,
: 如果你在50級分上下,平均約進步3.5級分,
: 如果在70級分上下,平均約進步0.3級分。
: (3)A與B呈現高度正相關,決定係數為0.7929;
: 也就是八成已經決定了!剩下兩成的努力空間。
: (4)MAX(B-A)=33;MIN(B-A)=-23。
: 3、這份統計資料來自植物園高中,102最後一次北模與學測成績比較,
: 是否能推論到其他學校與其他年度,也有待確定。
: (另外一個方式說,用貴校去年的資料,會相對準確一些)
敝人不才,看到以上這個分析,
就讓我手癢想來檢測看看平均而言差1.4級分在統計上到底算不算顯著
所以我用R Studio下去跑學生t檢定,跑的資料就是這份102年的統計資料
我的假設如下:
H0(虛無假設):學測成績平均級分小於等於北模成績平均
上面這句話的意思代表兩件事情:
1. 你在最後三十天的努力是沒用的甚至更慘
2. 你老師只是在安慰你。
Ha(對立假設,要是H0被拒絕則用這條):學測成績平均大於北模成績平均
這句話就代表你的努力是有意義的。
程式碼附在下面
> dat = read.csv("北模學測成績比較.csv")
##我先把檔案換成csv檔,不然不能用
> before = dat$模考
> after = dat$學測
> t.test(after, before, alternative = "greater", paired = TRUE, conf.level=0.95 )
##抱歉上面這行有點長,自己複製的時候注意一下
最後得到的結果如下
paired t-test
t=11.777 df=1233 p-value<2.2E-16
t在df=1233下的臨界值大概是1.64,老實說這已經很接近常態分佈
但是這不是重點,來檢驗吧!
在做t檢定的時候,我們的t值要是大於臨界值
我們就會拒絕虛無假設(Reject H0)
同時,要是我們的p值小於我們的顯著水準
我們也會拒絕虛無假設
在這個例子裏面,我們的信心水準定95%,也就是顯著水準0.05
顯然t值11.777是大於1.64的,
故以t值檢驗,我們會拒絕H0
又,我們的p-value小於2.2*10^-16,
故以p-value檢驗,我們一樣會拒絕H0
所以採用Ha的結果就是,
我們在最後幾天努力還是有意義的!(灑花)
可喜可賀,可喜可賀。
※Reference:
沈明來,《生物統計學入門》第六版(九州圖書,2016.9)
白經濟,〈統計術語小教室:你說的是真的嗎?〉
網址:https://talkecon.com/statistics101/
作者: whitejason05   2018-01-01 23:55:00
感覺像是複雜的幹話
作者: takeyourtime (鐘點戰)   2018-01-07 00:32:00
推這篇認真!4樓對幹話最有研究

Links booklink

Contact Us: admin [ a t ] ucptt.com