針對以下這段進行回應
推 chons2332: 我以我高中學到的數據分析來講:假設總分5分,平均3分, 04/17 11:35
→ chons2332: 標準差0.5,且分數只有整數形式(即只有1、2、3這種形 04/17 11:35
→ chons2332: 式)那你一樣拿4分的人就包含了2種標準差的人,程度落 04/17 11:35
→ chons2332: 差成這樣,能夠說鑑別度好嗎?同樣的情形如果拉大分數 04/17 11:35
→ chons2332: 上下限就可以提升鑑別度阿。當然我講的比較極端一點, 04/17 11:35
→ chons2332: 有錯請指正 04/17 11:35
→ Apache: http://bit.ly/2D6DnnZ 定義問題 04/17 11:37
→ Apache: 你提的這個是標準差過小 不是刻度太大的問題 04/17 11:40
→ Apache: 太多人塞在3分 04/17 11:41
→ chons2332: 敢問你認為標準差多少是合理的呢,若我把分數上下限從5 04/17 11:48
→ chons2332: 拉到100標準差就放大20倍(如果我沒記錯的話)標準差就 04/17 11:48
→ chons2332: 來到了10,我認為我取的標準差應該沒有太小的問題。另 04/17 11:48
→ chons2332: 外太多人卡在3分不也是因為刻度太大使可能表現在2.1或3 04/17 11:48
→ chons2332: .9的人分不出來嗎 04/17 11:48
→ chons2332: 另考題的鑑別度的確也是區別考生的一項重要指標 04/17 11:49
你高中學的沒錯
但是依照你的邏輯推論的話會有錯誤點在於
同樣的分數上下限放大20倍 分數通常不會X20 所以標準差不會這樣增加
實際上呢 鑑別度的定義Apache貼出來了 不過鑑別度可能在這邊不太適用
那個比較適合解釋要怎樣出考題(?)
我理解下的Chons想問的問題應該是一個考試要怎樣有適合的方式分出學生的程度
並且你要用什麼方法去分析你這考試出來的結果有沒有達到你要的標準
其實這有個問題就是 學測的目標並不是全然是區分學生程度
更多在於要檢驗學生是否達到該段課程所要求的能力
我個人也覺得這樣沒有什麼不適合(?) 否則要比較個人能力的話
我建議內容直接加考大一普物化生微積分經原^^
所以極前段考生實力無法完整檢定這件事情 學測沒辦法作到 因為這跟他的目標相衝
而中後段的學生 其實本來每個人水準就差不多
當然你會Claim哪有 人其實可以差很多的 所以我們要切成很細很多分
可是讓我們從這個角度去切入 當你假定人的能力是可以用考試評量的時候
真正想評估的應該是這個人每天的能力隨機分布的期望值
而不是看他今天腦袋有沒有骰到Lucky20 所以說 你把分數切很細
反而沒辦法評量一個人的實力""區間""應該在哪裡
他可能只是因為今天骰個lucky20 腦袋如有神 不是他正常水平
或者他衰神上身 腦袋打結 今天各種突然想不通
統計學上有一點很重要的就是說 你想把同樣的信心水準的區間壓小
你要做的事情是加大樣本數量 以學測這個測定方法來講
你要做的事情是考個N次學測取找一種方法取均值
而不是一次考數細分成更多分數
那樣只是你假裝你的區間更細 但是你的樣本強度並不夠支持 自欺欺人
當然啦 還有一種方法也可以把區間壓細 那就是放寬信心水準的要求^^
信賴區間的算法形式是類似這樣 [平均值+- z*標準差/根號樣本數]
而越大的Z對應越高的信心水準^^
所以只要你想讓分數越沒有辦法代表一個人 就把分數區間切更細^^
那你測錯一個人的實力的可能就增加了