(i) |
分数的解析 |
| |
—— |
单看原始分数容易造成解释错误,采用“百分比等级”(Percentile)
来解释分数将更全面。 |
(ii) |
考题区分能力的计算 |
| |
—— |
通过鉴别度指数来鉴别考生的能力。 |
| |
—— |
通过点二系列相关系数来测量个别题目对整份试卷总分的贡献程度。 |
(iii) |
难度 |
| |
—— |
指考生的选答率。难度适中的题目才具有鉴别力。 |
(iv) |
效度 |
|
| |
—— |
由全份试卷题目的“双向细目表”及“试题品质与类式”判断该份试卷的测试是否有达成测试目标。 |
(v) |
可信度 |
|
| |
—— |
由全份试卷的试题难度及鉴别度等判断该份试卷的测试是否可靠。 |
| |
|
|
| (一)有关试题分析的几个基本概念 |
| |
|
|
| (甲)
项目统计分析(Item Statistics) |
| 1. |
难度指数(Proportion Correct)(介于0至1之间)(P)
|
| |
1.1 |
0
— 太难,以至无人能正确反应; |
| |
|
1
— 太容易,每一个人都能正确反应。 |
| |
1.2 |
理想难度指数:0.5左右。 |
| 2. |
鉴别度指数(Disc. Index)(D)
|
| |
|
对答案所在的选项而言:
|
| |
|
D = 高分组考生选答百分比-低分组考生选答百分比。(D
= P高-P低) |
| |
2.1 |
D介于
-1 至 +1之间。 |
| |
2.2 |
理想鉴别度指数:≥0.3。 |
| |
例: |
第1题的鉴别度指数是:0.83
– 0.34 = 0.49; |
| |
|
且大于0.3,所以这道题目可说具有鉴别力。 |
| |
2.3 |
鉴别度指数低(即,不太具鉴别力)可能由下列因素造成: |
| |
|
*
能力低的学生胡乱猜测,结果碰巧猜对; |
| |
|
*
能力高的学生看不懂题目、会错意、粗心大意。 |
| |
2.4 |
难度与鉴别度的关系: |
| |
|
适当的难度是高鉴别度的必要条件;当D
= 0.5时,该道试题可说是拥有最佳的鉴别能力。 |
| 3. |
点二系列相关系数(Point Biserial)(r)
|
| |
3.1 |
用以检查试题的信度。 |
| |
3.2 |
“相关”是指考生是否答对本题与考生在整份试卷得分高低的相关; |
| |
3.3 |
r介于
-1至 +1之间 |
| |
3.4 |
r
为正,表示答对/错本题的学生,其在整份试卷的总得分也高/低; |
| |
|
r为负,表示答对/错本题的学生,其在整份试卷的总得分却低/高(表示这道题目可能隐藏一些问题)。 |
| |
3.5 |
在选择题里,正确的答案选项的r应为正,其他选项的r应为负。 |
|
| |
|
|
| (乙)
选项统计分析(Alternative Statistics) |
| 4. |
Alternative:即答案的“选项”。
|
| 5. |
Prop Total即:全体考生选答某个选项的百分比。
|
| |
例:第1题,共有59%的考生选答C
|
|
6. |
低分组学生选答该选项的百分比。
|
| |
例:第1题,低分组的学生中,有34%选答C
|
|
7. |
高分组学生选答该选项的百分比。
|
| |
例:第1题,高分组的学生中,有83%选答C
|
|
8. |
Key: * 表示标准答案 |
|
| |
|
|
| (丙)统计图 |
| 9. |
偏态(Skew)(g1) |
|
| |
9.1 |
用以了解分数的分布情况。 |
| |
9.2 |
正偏态时
(skewed to the left), |
| |
|
g1
> 0;表示比较多的考生集中在低分区。 |
| |
9.3 |
负偏态时
(skewed to the right), |
| |
|
g1
< 0;表示较多的考生集中在高分区。 |
| |
9.4 |
g1
= 0时,表示分数呈常态分布 |
| |
|
(normal
distribution)。 |
| |
|
|
|
| 10. |
峰度(Kurtosis)(g2)
|

|
| |
10.1 |
用以了解分数分布在平均数四周的情况。 |
| |
10.2 |
高狭峰(leptokurtic),g2
越大(g2>0), |
| |
|
表示分数落在平均数的考生较多。 |
| |
10.3 |
低阔峰(platykurtic),g2越小(g2<0), |
| |
|
表示分数落在距离平均数较远之处的考生较多。 |
|
|
10.4 |
g2
= 0,表示分数平均分布于平均数的四周。 |
|
| (二)注意事项 |
| (i) |
若出现“check the key”的题目,应思考:这道题目有着什么问题?出题时有什么疏忽?教学时对有关知识的观念的传授有没有很好地掌握?日后应如何加强教学? |
| (ii) |
每一题的难度指数是否介于0.4至0.6之间?
—— 难度处于此范围内的题目是较好的测试题。 |
| (iii) |
每一题的鉴别力指数是否大于0.3? |
| |
—— |
鉴别力指数大于0.3的题目才能区分出考生能力的强弱分布。 |
| |
—— |
若鉴别度太低意味着对有关题目而言,能力弱的学生猜题,碰巧猜对;而能力强的学生则粗心大意、误解题意、遗漏等。 |
| (iv) |
每一题的点二系列相关系数是否是“+”数(即正数)? |
| |
—— |
点二系列相关系数为“+”,即表示能力强的学生答对,能力弱的学生答错。 |
| (v) |
选项的诱答力是否恰当? |
| |
—— |
选项的选答率过低即表示该选项无诱答力。诱答力太低的选项是装饰性选项,应尽量免掉。 |
| (vi) |
看看峰度 |
| |
—— |
可看出考生分数在平均数四周分布情况。分两类: |
| |
① 高狭峰(Leptokurtic) |
| |
—— |
分数落在平均数上或很接近平均数的考生居多。 |
| |
② 低阔峰(Platykurtic) |
| |
—— |
分数落在平均数以外或较远之处的考生居多。 |
| (vii) |
看看偏态
—— 可看出全体考生得分分布情况。分两类:
① 正偏态(Skewed to the left)
—— 较多考生集中在低分区。
② 负偏态(Skewed to the right)
—— 较多考生集中在高分区。 |
| (viii) |
将试题难度分布情况加以统计并绘图表示。
例: |
| |
某科选择题共15题,
试题难度分布统计如下: |
| |
 |