[請益] 樣本問題

作者: weareyoung (weareyoung)   2015-11-05 15:38:20
ABC三個學生跑資料庫抓精神疾病
A的總樣本是全部的人50幾萬,有精神疾病的人是44%
B總樣本數沒A多但應該有幾十萬,精神疾病41%
(老師說差不多)
C總樣本是A的樣本中擷取有職業傷害的人,樣本數三萬多,精神疾病20幾%而已。
會差那麼多是因為總樣本人數C比較少的關係嗎?還是跟總樣本無關,是比例問題?
也就是說C雖然3萬多人但應該也要跟A,B一樣是40幾%
作者: blence ( )   2015-11-05 16:11:00
在考慮是不是也40%之前,已經排除職業傷害的影響了嗎
作者: milk0925 (廢物是種尊稱)   2015-11-06 15:05:00
以下說明只是我個人淺見,略供參酌。假如A和B皆是用近乎隨機取樣的方式進行抽樣(畢竟現實上是很難做到完美的隨機取樣),那麼接下來我會想到的是,C多設定了一個條件:「有職業傷害的人」,我不知道C是怎麼定義這個職業傷害的,因為"通常"如果疾病狀況比較嚴重的話,可能也因此在工作的部分會有一些困難,意思也就是在臨床上通常他們比較少是有工作的,所以當C多設定了「有職業傷害的人」這個條件時,可能就有機會把一部份確診,而且相對狀況比較嚴重的病人篩選掉了。因此我會疑惑的是,C的「有職業傷害的人」這個條件,是不是也同時代表著這些人在抽樣當時是有工作的?

Links booklink

Contact Us: admin [ a t ] ucptt.com