Moodle测验统计数字是什么意思?

恭喜你! 您在Moodle中进行了测验,学生参加了测验并准备好成绩。 那你从这里去哪里呢?

通过Moodle进行测试的一种优势是Moodle可以为您生成有关学生刚刚参加的测验的统计报告。 借助此报告,您可以评估您的评估并确保它正在完成您想要的工作,或者发现您的学生可能仍在挣扎的误解。

测试评分完成后,打开测验活动,并按尝试次数显示结果页面。 在此页面上,您可以查看学生的个人尝试,但要获得概述,请向下滚动到测验管理块并按统计信息

报告的第一部分介绍了测试的总体结果。 在这里,您可以找到诸如平均成绩,中位成绩和结果的标准差之类的信息。 一般来说,教师的平均目标是70年代,但这确实取决于课程和学生的背景。 如果您正在教授较小的高级课程,则测验或测试的平均成绩可能会更高。 标准偏差完善了平均值的含义,提供了一个范围,可用于查看与平均值相比的成绩差异。 标准偏差值的建议范围约为12–18%。

除了这些基本措施之外,Moodle还会进行一些其他计算,并将这些数字报告给您。 其中第一个是分数分布偏度或简称为偏度。 偏度是结果分布的不对称或倾斜。

(图片:维基共享资源)

斜率的陡度指示了对测试的区分程度。 在负偏斜下,对于成绩较高的学生,测试的区别较小。 偏斜测试为阳性可能意味着您的测试在区分刚刚通过或未通过测试的学生方面做得很差。 建议在-1.0左右寻找负数。

下一个元素是分数分布峰度。 老实说,这不是我理解的要素。 从统计角度看分布的尾部,并从分布曲线中放大离群值。 峰度的问题可能是样本量较小,因此在查看此数字时可能要牢记。 Moodle的建议范围是0到1。

内部一致性系数是克朗巴赫(Cronbach)的alpha,是测试在整个问题中评估同一事物的度量。 计算使用得分的方差并产生百分比作为结果。 100%的分数应该是不可能的,但是如果您一直关注这一指标,则分数越高越好。 内部一致性系数也用于错误比率和标准比率数字。

误差率使用内部一致性系数来表示多少标准偏差可能由机会因素而不是技能差异组成。 在这种情况下,分数越低越好。 如果您对此感到困难,则可能存在一些因素,例如问题库中的某些问题可能比其他问题容易得多或困难得多,如果您从中提出了一系列问题,则某些学生的考试可能比其他学生更难池。

“标准错误”结合了测试的标准偏差和错误比率的度量,以设置希望学生进行类似测验的成绩范围。 对于考试,如果学生的考试成绩为85%,而标准误为5%,则可以预期该学生的分数在80%至90%之间。 Moodle开发团队建议您将此数字保持在较低的水平,建议将该分数保持在8%以下。

Moodle将对整个测试进行大量计算,但也会针对每个问题生成有关测试的报告。 该报告受测试设计的影响。 如果您使用问题库中的随机问题池,而不是专门选择所有学生都收到的问题,那么结果将是较差的。 您还需要对测验中的所有问题进行评分,然后此报告才会出现。

针对问题显示的第一个度量是该问题出现的尝试次数,如果您从大量问题中撤出,则某些问题可能恰巧出现在比其他问题更多的测试中。

设施指数表示正确回答问题的学生数量(如果您有多个正确答案的问题,则部分正确)。 设施指数由平均分数除以最大分数确定,并以百分比表示。 这是检查是否存在设置错误的问题的最佳方法,或者确定课程中学生可能较弱的地方。 您也可以使用便利设施索引来识别过于简单的问题。 这是开始评估您的问题库并询问自己问题是否正在完成您设计的目的的好地方。

Moodle还将在问题级别确定标准差。 值得注意的是,此处的低标准偏差并不表示问题必须经过精心设计。 如果这个问题对每个人都很容易或非常困难,那么分数不会有很大的差异,因此标准差会很低。 对于那些旨在区分较强和较弱学生的问题,标准差变得更加重要。

最后两个基本度量是随机猜测分数和预期权重。 随机猜测分数是学生仅通过随机选择答案即可获得的该问题分数的百分比(例如,如果该问题有4个可能的答案且只有一个答案正确,则随机猜测分数为25.00%)。 预期的权重是该问题在测试中应该值多少。 基本上,这是该问题的最高分数除以百分比表示的测试最高分数。

Moodle将针对问题向您提供另外三份报告:问题的有效权重,歧视指数和判别效率。 有效权重是一个要与问题的预期权重进行比较的数字,它估计单个问题对学生总分的分数变化量。

有效权重不是实际回答对与错的学生的百分比。 您可以使用设施索引相同的两个问题,但是有效权重不同,即使它们在测试中均值1分。 相反,有效权重使用问题的协方差,查看单个学生的尝试并与该学生在测试中的分数进行比较。 因此,如果您的学生在一个问题上获得1分,并且最终分数为60分,那么该问题对学生的得分的贡献要大于对80分的学生。

考虑到学生在该问题上的表现与其他学生的表现相比,歧视指数试图代表该问题的质量。 不幸的是,每当设施指数高或低时,辨别指数就会低。

歧视效率是试图避免该问题的类似报告。 辨别率为10或更低的问题的问题文本以红色突出显示。 对于设施指数在30到70之间的问题,区分效率最有效。不可能达到100%的分数,但分数越高越好。

如果您有兴趣查看这些报告中使用的确切公式,请查看Moodle统计信息计算页面(https://docs.moodle.org/dev/Quiz_statistics_calculations)。 如果您想使用自己的公式进行核对,则可以从“测验结果”页面下载结果,也可以导出成绩簿。 但是,要进行特定于问题的计算,您将需要一个包含每个问题以及每个学生在这些问题上的分数的电子表格。

因此,希望能弄清楚这些数字的含义,如果您正在寻找一些解决问题的策略,我们将来会谈论更多的测验统计信息,或者随时在电子学习办公室与我们联系!