标签:
一、引言
题库类产品(如猿题库、易题库等)的一个标配功能是预测用户未来要进行的某项考试得分,我们称之为目标考试预测分。以猿题库高考为例,即将参加高考的学生通过在题库上做大量练习,练习的效果会以学生的高考预测分呈现出来,这是学生最关注的指标,也是整个题库产品中最关键的数据。
为了让“预测分”数据更加准确,我们引入了能力评估模型,通过测算用户在所有知识点上的能力水平,并将其量化成为一个数值。能力评估模型中有两个重要参数:题目难度值、用户答题的正确率。简化为:
A=f(an,d)
其中A表示能力值,an表示所做n道题目的难度值,d表示用户做这n道题目的正确率。参数d的值是可轻易计算得出,而an的值决定于这n道题每一道题的难度值。
于是,单题难度值的计算成为准确预测用户预测分的关键因素。
二、什么样的题目才算“难题”
我们这样定义“难题”:解题的逻辑、思路迂回复杂,所关联的知识点综合性强。
有一些情形,表面上似乎能证明这是一道“难题”,但并不属于我们考虑的范围:
这些因素会在后续计算难度系数时剔除掉。
三、如何给一道“难题”确定难度系数
难度系数反映题目的难易程度,描述考生在答题时的失分情况。一般地,难度系数的计算公式为:
L=1-X/W
其中,L为难度系数,X为样本平均得分,W为试卷总分(对于单题而言,W为该题的分值)。
这是在有足够答题数据的前提下建立的难度计算公式,而题库类的产品中题目被作答的次数是有一个累积的过程,对于新入库的题目,这个计算公式并不适用。针对题库产品的特性以及题目难度系数计算公式的适用问题,我们按以下步骤来确定并校准题目的难度系数:
四、小结
引入经典的难度系数计算公式,再通过与人工标记的难度值进行比对修正,使得题目的难度量化更加合理,为能力评估模型提供更准确的参数。
标签:
原文地址:http://www.cnblogs.com/eecc/p/4579604.html