要实现全球最高教育目标,请不要迷失于衡量

在围绕标准化测试以及如何最好地衡量学生学习的热情洋溢的辩论中,经常会忘记一个关键事实:评估本身并不是目的,而是目的。 他们可以更好地了解孩子们正在学习(或不学习)的信息,这些信息可用于改善课程,指导和最终学生的学习。 此信息有很多不同的途径。 不论其设计是什么,胜任的评估都对如何改善结果提供了关键的启示-关键在于实际使用数据。 教育工作者在追求历史上最雄心勃勃的教育改善计划时必须牢记这一真理。 上个月,在由联合国教科文组织统计研究所(UIS)和世界银行主办的新的全球学习监测联盟的发起下,捐助者,研究人员,从业人员和技术专家开会讨论了关于可持续发展目标(SDG)4.1报告的选项。该计划保证,到2030年,各国将“确保所有男孩和女孩都完成免费,平等和优质的初等和中等教育,以取得相关和有效的学习成果。”为衡量实现这一目标的进展,各国将报告儿童所占百分比/年轻人(i)2/3年级,(ii)在小学结束时,(iii)和初中结束时,至少达到了阅读和数学的最低要求。 在美国“退出”标准化测试的强劲运动中,值得注意的是,许多其他国家也要求更多。 但是在整个SDG流程中,利益相关者都坚信学习不仅是获得教育的机会,而且对于新的教育目标至关重要。 那么,负责监督实现这一目标进展情况的教科文组织统计研究所如何将国际,区域和国家评估的复杂拼凑在一起,以汇报学习情况? 问题的症结在于“可比性”的含义。在最近的博客中,UIS负责人感叹“每个评估都有其自己的框架和方法,无法比较结果。”但可以肯定的是,我们可以进行排序找出一些有效的比较形式(请注意,与陈词滥调相反,苹果和橘子都是圆形的,可以去皮,有种子,可以在树上生长)。 知道技术官僚们倾向于使事情变得比可能需要的技术更多,在这种情况下,以现有努力为基础的简单方法是最佳解决方案。 根据统计研究所的数据,大多数国家已在一个或多个要求的年级上进行了学习评估。 各国可以利用这些结果来定义“阅读和数学的最低熟练程度”的含义,并报告达到或超过该标准的儿童百分比。 在我的孩子上公立学校的华盛顿特区,有25%的三年级学生的阅读能力达到或更高。 数学上是30%。 这些数据可以轻松地与其他州和国家/地区符合​​当地标准的孩子所占的百分比进行比较。 哥伦比亚特区的教育官员对能力的定义可能与丹麦或吉布提的教育部门官员的定义有所不同吗? 大概。…

关于政治的很多事(不读)

在南卡罗来纳州正在辩论新立法的过程中,注定要成为“成功阅读”,我与一些公共教育的大力倡导者接触,他们正在寻求方法以制定该州的有效阅读政策。 我的输入重点是承认研究基础,该研究基础驳斥了流行的政治议程,这些议程主要是模仿标准化的高风险测试和三年级学生的成绩驱动的佛罗里达阅读政策。 首先,数十年的研究表明,尽管人们普遍支持保留年级(并倾向于反对社会以促进社会发展),但保留年级对学生尤其是我们最脆弱的学生(生活在贫困中的学生,黑人和棕色学生,英语学习者)绝对有害)。 其次,佛罗里达州的模型具有足够的数据和研究得出的结论是,基于考试的三年级保留会在短期内增加考试成绩(我称其为误报,因为这可能仅仅是因为学生再次参加考试,并且可能不是阅读增长的迹象),但是那些幻影增益随着时间的流逝而消失(请参阅有关数据的Jasper博士论文)。 尽管如此,我很快获悉,尽管有缺陷,但将有两党支持一项新的阅读政策(Read to Succeed),因为会有大量的阅读资金投入。 快进到现在,即2018年秋天,第一批学生受到这项立法的影响- 《邮报》和《信使》 (南卡罗来纳州查尔斯顿)的Paul Bowers很好地记录了这些资料: 根据一项旨在保留阅读障碍学生的新法律,南卡罗来纳州的学校在2018-19学年阻止了约354名三年级学生。 这个数字代表了春季参加州立SC READY阅读子测验的三年级学生的一半,而只有8.5%的最低成绩学生获得了“ Not Met 1”的成绩。 虽然许多人认为这是提高州的阅读和识字能力的成功或失败,但这里的真正教训是关于政治以及出于教育目的的官僚主义措施的根本失败。…