胡中惠 SPACE


又一个WordPress站点

首页 >全部文章 > 正文内容
【高考数学】试卷质量的指标难度、区分度、效度、信度-TheFifthPostulate

多数学生和家长在评判某次考试考得“好不好”时,往往是看成绩多少、平均分多少、排名多少等等这些指标。这些指标非常直观,一定程度上也能够反映出学生的学习能力和学习情况。但是,如果只关心这些仍是不准确的,因为成绩(以及由成绩决定的平均分、排名等)会随着许多因素的改变而改变。具体而言,成绩作为一个外显的数字变量,会随着另一些内在变量的变化而变化(如试卷的质量、考生的心理、考试的时间地点环境等等)。因此,了解这些内在变量的属性,也就更能够多角度、深层次地评判某次考试考得“好不好”张无垢勤学。笔者在上一篇中曾说过非常重视试卷的质量,试卷的质量由许多因素决定,其中最主要的有难度、区分度、效度和信度。如果一张试卷的质量较高,那么考生的在这张试卷上取得的成绩就更有代表性、更能反映出考生的真实水平;反之一张试卷的质量较低,那么即使成绩较高也不一定代表考生的水平高,成绩较低也不一定代表考生的水平低。在历年的上海高考考纲中,都强调了试卷的这四个指标。在本文中,笔者从定量和定性的角度,并结合自己的体会,和各位读者简要地谈谈这几个度量指标的含义。


一、难度
对于同一道题,不同学生的感受是不同的。有的学生学习水平较高,或者做过类似的题,那么他就会觉得比较简单;反之,如果学生学习水平较差,李宇菲也没有做过类似的题,那么他就会觉得比较难。这样看来,难度似乎是一个带有主观性的指标。
为了使某道题的难度有个相对一致的解释,一种比较简单的方法是以该题的答对率来表示难度,即[正确回答该题的人数/所有回答该题的人数]。按此方法来定义难度,其数值越大(最大为1)难度越低;数值越小(最小为0)难度越高。例如,某道题全班40人中有28人答对,那么该题的难度就是0.7。
当然,在缺乏数据的情况下,无论是学生还是教师,更倾向于凭自己的主观感受和经验来评判某道题的难度。笔者认为对于数学题,决定学生能否做对的主观因素包括学生的粗心程度、心理素质等,客观因素主要有两点,即试题的思维量和计算量。所谓思维量,就是学生在理解题意、分析和转化问题、形成完整的解题思路等等这些过程中所要进行的思考程度的多少。所谓计算量,就是学生为了完成该题所必须进行的计算程度的多少。思维量意味着能否想到怎么做,计算量意味着在知道怎么做后能否算对我是大哥大,不同数学问题的偏重点是不同的。例如,“计算123456789×3.1415926”对于高中生而言没有太多的思维量,只需按部就班地计算即可,但计算量较大,要手算出正确的结果也非易事。再如,“解三次方程x3+7x2+17x+15=0”对于高中生而言思维量很大年妃,但如果知道了三次方程的一般解法,则计算量较小。这样看来,似乎思维量更能体现一道题的难度,因为它意味着创造出一套解法,而计算量则意味着按照现成的思路进行机械劳动而已。因此,笔者以后所谓的“难题”,主要是指思维量较大的题。
二、区分度
一张试卷难度怎样才合适呢?那要看考试的目的而定,比如高中学业水平合格性考试金钗谍影,以高中毕业为目的,就会出得简单些;高中数学竞赛,以选拔优秀数学人才为目的,就会出得难些;而高考作为高校选拔人才的重要途径,为了适应不同高校对于人才的不同要求,就必须能够筛选出不同层次的考生,这就不仅仅要考虑难度,更重要的是要考虑区分度。
所谓区分度麦洁文,是指试题对于考生的区分程度。试题的区分度较高,就能使水平较高的考生得高分、水平较低的考生得低分,将他们区分开来。计算一道试题区分度的常用方法是,[考试总分靠前的27%考生对于该题的答对率P减去考试总分靠后的27%考生对于该题的答对率Q]。如果P越大、Q越小,即P-Q越大,说明好学生中能做对该题的人越多,差学生中能做对该题的人越少,则该题的区分度就越高。
试题的区分度不仅和试题本身的提问方式、评分标准等有关,而且和难度也有关。试想一张试卷非常简单,几乎人人都能拿满分,就谈不上筛选不同层次的学生了。而一张难到几乎没人会做的试卷,也同样无法区分考生。这两种情况的区分度都较低。一般来说,难度适中的试题区分度较高。但这也并不意味着整张试卷每道题难度都要中等,因为区分度和难度都是相对的,难题对于高水平考生的区分度较高,简单题对于低水平考生的区分度较高,中等题则对中等水平考生的区分度较高。而考生的水平大致呈正态分布,因此试题难度也应大致以正态分布为宜,即难题和简单题较少,中等题较多,平均难度中等,这样的试卷具有较高的区分度。
三、效度
效度是指考试的有效性恐怖鸡,即这次考试能否真正反映出想要测试的内容,以及能够多大程度上反映出想要测试的内容。
如果高二的向量单元测试,考了这样一道题:
该题虽然涉及向量,但主要考点却是三角函数,因此作为向量的单元测试,该题的效度就比较低。又比如一次考试的不少试题又偏又难,超出教学大纲要求,那么其效度也比较低。可见,效度是评判一张试卷质量最重要的指标,如果试卷的效度较低,那么不论它有什么其他优点,都无法发挥其考查功能。
效度的种类有很多,计算也比较复杂,这里就不一一详述了。笔者想稍微谈谈自己对于效度的理解。笔者在看一道数学试题时,除了分析解题思路外,还经常思考这样一些问题:这道题在考什么?开心泡泡猫下载考点是否明确林桂生?这样的问法是否确能达到考察目的?有没有更好的问法?……有些题虽然出题意图是明确的,但学生未必会沿着命题者的思路来解,有可能会采取一些“捷径”方法,例如代入特殊值、排除法等等。同一个问题,不同的问法,产生的效果可能会很不一样。试比较以下两个问题

对于问题1,不少学生也许会采用f(0)=0,f(1)=-f(-1)等特殊值法来求a,而不考虑其他因素午夜之眼,这样也可以求出“正确”答案。但这样做没有充分用到奇函数定义,学生对于“f(x)=-f(-x)对定义域内任意x恒成立”中的“任意”、“恒成立”等关键字理解不够,本题就没有完全达到考察目的。问题2采用解答题的方式,要求学生完整地讨论奇偶性,这就要求学生根据定义写出详细的计算过程,而不能仅仅代几个数得出a的值就完事了。显然后者的效度更高,更能够考查出学生对奇偶性定义的理解程度。
笔者一直和学生强调,要用正确的方法得出正确的结论。所谓“正确的方法”,就是每道题都要用严谨的推理来分析,并写出每一步推理和计算过程,得到结果。笔者认为做数学题更应该注重思维过程而非结果,思维方式正确了,正确的结果就是水到渠成的事,这样才能够让自己做的每一道题更具有效度。有时候走捷径反而会错过沿途的风景。
四、信度
信度是指考试结果的一致性和稳定性,也就是考试成绩是否可信、是否能代表考生的真实水平。如果某个学生一次考试没考好,是否就意味着他学习水平不高呢?不一定。可能只是这次考试他没发挥好。但如果他考了好几次都没考好,也就是说这几次考试成绩都稳定在较低水平,那么基本上可以确定他的学习水平确实不高。如果几次考试的结果差别很大,时好时坏,那么可能说明试卷的信度较差,其结果不可信。
可见,为了确保试卷的信度,往往要通过几次考试。如果像高考不太可能考几次的话,也可以通过增加评分者的数量,并制定评分标准和流程来增加考试结果的信度。例如高考的阅卷,主观题至少由两位阅卷老师批改,如果他们的评分之差小于等于某个分值(例如2分),则取平均数作为最终成绩;如果他们的评分之差大于该分值,则再由第三位阅卷组长给出最终评分。
信度的分类计算也是一个复杂的问题,影响信度的因素也很多。对于一张孤立的试卷,很难说信度如何,也就是说很难单凭一次考试成绩判断考生学习能力如何。也不能简单地和上一次考试成绩比较就认为学习进步或者退步了,因为每张试卷的信度、难度都可能不同,应根据学生具体做题情况、错误原因等综合来考虑。
介绍了这些指标后,笔者想从这四个方面简单总结下高考试卷与一般试卷的区别。
难度方面,一般试卷的命题老师会根据自己学校学生的学习水平来控制试卷难度。重点中学的试卷相对较难,普通中学的试卷相对容易。因为同一学校学生的学习水平差别不大,难度比较容易控制。而参加高考的学生水平参差不齐,因此高考试卷应当考虑难度的分布问题,例如上海高考数学卷历年来简单题、中等题、较难题所占分值约为4:4:2。
区分度方面,一般试卷并不是作为筛选人才所用,因此在区分度方面考虑得较少。而高考要区分重点本科、普通本科、高职大专、艺体生等许多不同层次的考生,因此对高考试卷对区分度尤为重视。
效度方面,当然每个命题者都希望试卷具有较高的效度,但每个命题者对于考纲的理解并不完全相同,而要在短时间内出一道具有较高效度的题也绝非易事梁经伦。高考试卷的命题时间长,命题者的水平较高,加上大量数据的支持,一般能设计出在考纲范围内、具有引导性和启发性、能充分考察学生的各方面能力、避免学生采用“捷径”方法的试题,因此具有较高效度。
信度方面,这也是一般试卷较少考虑的问题。高考除了上述的阅卷制度外,也在尝试其他方法提高信度,例如上海英语的两次高考取高分,一定程度上缓解了考生某一次考试没发挥好,也就是成绩信度不高的问题。
总体来说,高考试卷的质量虽不能说完美无缺,但总体是比较高的,因此研究高考试卷的试题,比研究其他试卷中的试题显得更有意义。
最后还需补充的是,正如本文开始所说,试卷的质量也只是决定考试成绩的因素之一。考生的心理状态、考试的时间地点环境等也都会影响考试成绩。例如,一般而言过于放松或者过于紧张都不利于考生的发挥,适度紧张则更容易取得好成绩。再如,考试的时间如若安排在考生精神状态不佳的时候(如下午一两点,考生容易犯困)也不利于考生的发挥。另外,考试地点是否熟悉、考场的亮度温度湿度、监考老师的举止行为等等都会不同程度地对每一位考生产生正面或负面的影响。因此在评判某次考试考得“好不好”时,不仅要看成绩、排名等显性的数字南陵花神,还应留意试卷的质量以及那些相对隐形的因素。
上一篇:猛龙出击【馨儿聆听】杨洁《西游记》是我挥不去的痛-夜听致刘筱 下一篇:dnfce会封号吗

繁华落尽 转瞬即逝

我们需要透过一系列的训练来突破关卡,我们需要达到一个不受到过去历史的羁绊的心境,透过这样的心境,进而引导成为一个适合进行前进到战士人,我们需要成为一个完美无缺的战士,我们的目标是遵循着力量进入无限的领域和穿越!