(一)有关试题分析的几个基本点  
(i)
分数的解析
 
——
单看原始分数容易造成解释错误,采用“百分比等级”(Percentile) 来解释分数将更全面。
(ii)
考题区分能力的计算
 
——
通过鉴别度指数来鉴别考生的能力。
 
——
通过点二系列相关系数来测量个别题目对整份试卷总分的贡献程度。
(iii)
难度
 
——
指考生的选答率。难度适中的题目才具有鉴别力。
(iv)
效度  
 
——
由全份试卷题目的“双向细目表”及“试题品质与类式”判断该份试卷的测试是否有达成测试目标。
(v)
可信度  
 
——
由全份试卷的试题难度及鉴别度等判断该份试卷的测试是否可靠。
     
(一)有关试题分析的几个基本概念
     
(甲) 项目统计分析(Item Statistics)
1. 难度指数(Proportion Correct)(介于0至1之间)(P)
 

1.1

0 — 太难,以至无人能正确反应;
    1 — 太容易,每一个人都能正确反应。
 

1.2

理想难度指数:0.5左右。
2. 鉴别度指数(Disc. Index)(D)
    对答案所在的选项而言:
    D = 高分组考生选答百分比-低分组考生选答百分比。(D = P-P)
 

2.1

D介于 -1 至 +1之间。
 

2.2

理想鉴别度指数:≥0.3。
 

例:

第1题的鉴别度指数是:0.83 0.34 = 0.49;
  且大于0.3,所以这道题目可说具有鉴别力。
 

2.3

鉴别度指数低(即,不太具鉴别力)可能由下列因素造成:
    * 能力低的学生胡乱猜测,结果碰巧猜对;
    * 能力高的学生看不懂题目、会错意、粗心大意。
 

2.4

难度与鉴别度的关系:
    适当的难度是高鉴别度的必要条件;当D = 0.5时,该道试题可说是拥有最佳的鉴别能力。
3. 点二系列相关系数(Point Biserial)(r)
 

3.1

用以检查试题的信度。
 

3.2

“相关”是指考生是否答对本题与考生在整份试卷得分高低的相关;
 

3.3

r介于 -1至 +1之间
 

3.4

r 为正,表示答对/错本题的学生,其在整份试卷的总得分也高/低;
    r为负,表示答对/错本题的学生,其在整份试卷的总得分却低/高(表示这道题目可能隐藏一些问题)。
 

3.5

在选择题里,正确的答案选项的r应为正,其他选项的r应为负。
     
(乙) 选项统计分析(Alternative Statistics)
4. Alternative:即答案的“选项”。
5. Prop Total即:全体考生选答某个选项的百分比。
  例:第1题,共有59%的考生选答C
6. 低分组学生选答该选项的百分比。
  例:第1题,低分组的学生中,有34%选答C
7. 高分组学生选答该选项的百分比。
  例:第1题,高分组的学生中,有83%选答C
8. Key: * 表示标准答案
     
(丙)统计图
9. 偏态(Skew)(g1)

  

9.1

用以了解分数的分布情况。
 

9.2

正偏态时 (skewed to the left),
    g1 > 0;表示比较多的考生集中在低分区。
 

9.3

负偏态时 (skewed to the right),
    g1 < 0;表示较多的考生集中在高分区。
 

9.4

g1 = 0时,表示分数呈常态分布
    (normal distribution)。
     
 10. 峰度(Kurtosis)(g2)

 

10.1

用以了解分数分布在平均数四周的情况。
 

10.2

高狭峰(leptokurtic),g2 越大(g2>0),
    表示分数落在平均数的考生较多。
 

10.3

低阔峰(platykurtic),g2越小(g2<0),
    表示分数落在距离平均数较远之处的考生较多。

 

10.4

g2 = 0,表示分数平均分布于平均数的四周。
(二)注意事项
(i) 若出现“check the key”的题目,应思考:这道题目有着什么问题?出题时有什么疏忽?教学时对有关知识的观念的传授有没有很好地掌握?日后应如何加强教学?
(ii) 每一题的难度指数是否介于0.4至0.6之间?
—— 难度处于此范围内的题目是较好的测试题。
(iii) 每一题的鉴别力指数是否大于0.3?
  —— 鉴别力指数大于0.3的题目才能区分出考生能力的强弱分布。
  —— 若鉴别度太低意味着对有关题目而言,能力弱的学生猜题,碰巧猜对;而能力强的学生则粗心大意、误解题意、遗漏等。
(iv) 每一题的点二系列相关系数是否是“+”数(即正数)?
  —— 点二系列相关系数为“+”,即表示能力强的学生答对,能力弱的学生答错。
(v) 选项的诱答力是否恰当?
  —— 选项的选答率过低即表示该选项无诱答力。诱答力太低的选项是装饰性选项,应尽量免掉。
(vi) 看看峰度
  —— 可看出考生分数在平均数四周分布情况。分两类:
  ① 高狭峰(Leptokurtic)
  —— 分数落在平均数上或很接近平均数的考生居多。
  ② 低阔峰(Platykurtic)
  —— 分数落在平均数以外或较远之处的考生居多。
(vii) 看看偏态
—— 可看出全体考生得分分布情况。分两类:
① 正偏态(Skewed to the left)
—— 较多考生集中在低分区。
② 负偏态(Skewed to the right)
—— 较多考生集中在高分区。
(viii) 将试题难度分布情况加以统计并绘图表示。
例:
  某科选择题共15题,
试题难度分布统计如下: