[問題] t檢定之t值相同p值不同問題請益

作者: lapavoni (lapavoni)   2015-06-01 10:33:53
文章分類提示:
- 問題: 當你想要問問題時,請使用這個類別
[問題類型]:
經驗諮詢(我覺得我的t檢定是不是出問題了...)
[軟體熟悉度]:
使用者(已經有用R 做過不少作品)
[問題敘述]:
目前在處理一份問卷分析,受試者目前依性別分為兩個Group(兩組人數不同),
題目作答類型為五點計分,其中有兩題的t檢定跑出來的結果t值都是-2.0,但
是兩個p值差很多,一個有顯著,另一個則沒有,還有它df的算法我也不太懂...
[程式範例]:
======================================================================
第八題的兩組作答資料為:
> gb8
[1] 4 3 2 2 4 3 4 3 3 2 3 4 2 1 4 2 3 4 2 3 1 2 3 3 4 3 2 2 2 3 2 2 3 3 2 2 1 3 4 4 3 3 4 3 4 3 3 2 3 4 3 3 2 4 4 4 3 3 3 4 2 4 3 2 2 2 3 2 3
[70] 3 3 2 3 3 3 4 2 3 4 3 4 3 3 3 3 3 3 2 3 3 4 3 3 3 4 2 3 2 4 2 3 3 3 4 4 4 3 2 3 3 3 3 3 2 3 3 3 3 3 3 3 3 2 3 3 3 1 4 2 3 3 3 3 3 3 2 2 3
[139] 4 2 2 3 2 1 2 3 2 3 2 4 2 2 3 3 2 3 3 3 4 2 4 1 3 3 3 1 3 3 3 3 2 3 2 3 3 4 3 3 4 3 3 3 3 4 3 2 3 3 3 3 2 4 3 3 3 3 3 3 2 3 3 3 3 2 2 3 4
[208] 3 3 2 2 2 1 1 4 2 3 4 2 3 2 3 4 3 2 3 3 4 3 2 3 3 3 4 2 2 3 2 3 3 3 4 4 3 3 3 3 1 2 3 3 3 3 4 4 3 3 3 3 3 3 3 4 2 3 3 3 4 3 2 3 3 3 3 3 3
[277] 3 2 3 3 3 3 3 3 3 3 4 2 2 3 3 4 3 3 3 3 4 3 3 2 4 3 2 2 2 3 3 4 3 4 3 2 1 1 3 3 3 1 3 3 3 3 2 3 3 3 2 3 4 4 4 4 3 3 4 4 3 2 1 3 3 4 3 3 3
[346] 3 3 3 3 2 4 4 3 3 3 4 3 3 3 3 3 2 3 3 1 3 3 3 3 3 3 3 3 2 2 3 4 3 2 3 4 3 3 3 2 3 3 3 3 3 3 3 3 2 3 4 3 4 2 4 4 3 2 3 3 3 3 2 3 2 2 4 2 3
[415] 3 4 4 4 3 3 3 3 3 2 4 3 4 3 3 3 4 4 4 3 3 3 2 3 3 3 2
> sb8
[1] 3 2 2 3 3 3 3 3 3 3 3 3 2 3 4 3 4 2 3 3 4 4 2 3 4 3 3 3 2 2 2 3 3 4 2 4 3 3 3 3 3 2 3 4 3 3 4 4 4 3 3 3 2 3 4 3 3 4 3 4 3 4 3 2 3 3 3 3 3
[70] 3 3 2 3 3 3 2 3 3 3 4 3 3 3
t檢定的結果為(兩組變異數有顯著差異)
> t.test(gb8,sb8,var.equal = FALSE)
Welch Two Sample t-test
data: gb8 and sb8
t = -2, df = 100, p-value = 0.1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.2691 0.0259
sample estimates:
mean of x mean of y
2.90 3.02
=========================================================================
第9題的兩組資料為
> gb9
[1] 4 3 2 2 3 3 4 3 3 2 3 4 2 1 3 2 4 4 2 3 2 3 3 3 3 2 3 2 2 3 2 3 3 3 2 1 1 3 3 4 3 3 3 3 4 3 3 2 3 3 3 3 3 4 3 4 3 3 3 2 2 4 3 2 2 2 2 4 2
[70] 3 3 2 3 2 3 4 2 3 3 3 4 3 3 3 3 3 3 2 3 3 4 3 3 3 4 2 3 2 3 3 3 3 2 4 4 4 2 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 2 3 3 1 4 2 3 3 3 3 3 3 2 2 3
[139] 4 2 2 3 2 2 2 2 3 4 3 4 2 2 3 3 2 3 3 3 4 2 4 1 3 2 2 2 3 3 3 2 2 3 2 3 3 4 3 3 4 3 3 3 3 4 4 2 3 3 3 3 2 3 3 3 2 3 3 3 2 3 4 3 3 2 2 3 3
[208] 3 3 2 2 2 3 2 3 2 3 3 2 3 2 3 3 3 3 3 3 4 3 2 3 3 3 4 3 3 2 2 3 3 3 4 4 3 3 3 3 2 3 3 3 2 3 4 4 4 2 4 2 3 3 2 4 3 3 3 2 4 3 3 4 3 3 3 2 2
[277] 3 2 2 3 3 3 3 3 3 3 3 3 2 3 3 4 3 3 2 3 4 3 2 3 4 3 2 3 2 3 3 4 3 3 3 2 1 2 3 3 3 1 3 3 3 2 2 3 3 3 2 3 4 4 4 4 3 3 4 3 3 2 3 3 3 4 3 3 4
[346] 3 3 3 3 2 3 4 3 3 4 2 3 3 3 3 3 2 3 3 1 2 3 2 3 3 3 3 3 2 2 3 4 3 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3 3 3 4 2 3 4 2 2 3 3 2 3 2 3 2 2 4 3 3
[415] 3 4 3 4 3 3 3 3 3 3 3 3 4 3 3 3 4 4 3 3 3 3 2 3 3 3 2
> sb9
[1] 3 2 3 2 3 3 3 3 4 3 2 3 3 3 4 3 4 2 3 3 4 4 2 3 3 3 4 3 2 3 3 3 3 4 3 4 3 3 3 3 3 3 3 4 3 3 4 3 2 3 3 3 2 2 4 3 3 4 3 4 3 4 2 2 3 3 3 3 3
[70] 3 3 3 3 3 3 2 3 3 3 4 3 3 3
t檢定結果為
> t.test(gb9,sb9,var.equal = FALSE)
Welch Two Sample t-test
data: gb9 and sb9
t = -2, df = 100, p-value = 0.02
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.3043 -0.0265
sample estimates:
mean of x mean of y
2.87 3.04
=======================================================================
想請問一下,我該如何解釋這樣的結果,一般狀況下p值不是由t值和df值推出來的嗎?
另,那個df=100又是如何算出來的呢?
[環境敘述]:
R version 3.2.0 (2015-04-16)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.9.5 (Mavericks)
locale:
[1] zh_TW.UTF-8/zh_TW.UTF-8/zh_TW.UTF-8/C/zh_TW.UTF-8/zh_TW.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] epicalc_2.15.1.0 nnet_7.3-9 MASS_7.3-40 survival_2.38-1 foreign_0.8-63 gplots_2.16.0 plyr_1.8.2 reshape2_1.4.1
[9] xlsx_0.5.7 xlsxjars_0.6.1 rJava_0.9-6 ggplot2_1.0.1 questionr_0.4.3
loaded via a namespace (and not attached):
[1] Rcpp_0.11.5 highr_0.5 bitops_1.0-6 class_7.3-12 tools_3.2.0 digest_0.6.8 gtable_0.1.2
[8] shiny_0.11.1 proto_0.3-10 e1071_1.6-4 stringr_0.6.2 gtools_3.4.2 caTools_1.17.1 classInt_0.1-22
[15] grid_3.2.0 R6_2.0.1 RJSONIO_1.3-0 gdata_2.16.1 scales_0.2.4 htmltools_0.2.6 splines_3.2.0
[22] mime_0.3 xtable_1.7-4 colorspace_1.2-6 httpuv_1.3.2 KernSmooth_2.23-14 munsell_0.4.2
>
[關鍵字]: t-test
選擇性,也許未來有用
作者: allen1985 (我要低調 拯救形象)   2015-06-01 12:22:00
自由度不一樣? Google 一下公式
作者: b10009047 (Nicklee)   2015-06-01 12:24:00
自由度的部分, google t-test wiki中有個變異數不相等的情況下, 有個公式用來算自由度的, 可能是那個p.value由定義看若檢定統計量和自由度一樣, 應該要相等唯一想的到的只有t值後面小數點是不是被捨去了
作者: allen1985 (我要低調 拯救形象)   2015-06-01 12:39:00
自由度一樣 剛剛沒仔細看完 可以upload你的data嗎By the way 這資料可能不太適合用t-test
作者: andrew43 (討厭有好心推文後刪文者)   2015-06-01 14:06:00
t.test(...)$statistic 看看t值是不是相同。
作者: allen1985 (我要低調 拯救形象)   2015-06-01 14:44:00
t值 跟 df值(此條件下) 沒有特別設定 通常不會是整數
作者: lapavoni (lapavoni)   2015-06-01 15:58:00
先感謝各樓回答,手機回應有些限制,回家後以電腦完整回覆經由b10009047,allen1985兩位的提示,原PO再回家檢查了一次程式,證實是很前面的小數點控制影響到t值,造成大家的困擾,原PO在此謝罪 XD

Links booklink

Contact Us: admin [ a t ] ucptt.com