最近与统计方法有过任何接触的任何人都知道,统计方法的未来正在发生一场战斗。 实际上,不止一个; 最大的是显着性测试与置信区间,贝叶斯与频繁性。 各种科学中的所谓“复制危机”为人们提倡对困扰统计实践的问题的各种解决方案提供了机会。 这些问题是真实存在的,风险很高:错误的选择可能意味着在错误的方法论上徘徊40年,而不是清理各个领域的混乱局面。
在最近的加的夫皇家统计协会会议上,我很高兴获得Mayo的最后一本“严峻测试中的统计推论:如何摆脱统计战”。 副标题中写道,梅奥的目标是雄心勃勃的:我们能否真正摆脱几十年来的激烈战争? 特别是在各个角色塑造未来的机会如此巨大的时代?
但是,现在是超越这些“战争”的最关键时刻。 我们需要的是在统计学理论基础之上的讨论:我们需要哲学。 只有广泛地了解科学中的统计推论,我们才能确保在尝试保存科学时不会损害科学。 这是梅奥的书的出发点。
我目前正在阅读文本,在完成本节的内容时,我会尝试在博客中添加一些注释。 这篇文章是关于概率和性能之外的第一个“游览”。
- 原因是什么?
- 一个名叫奥夫的男人:与命运的斗争失败
- 米歇尔·亚历山大(Michelle Alexander)的“新吉姆·乌鸦”:评论
- 错失的机会:《天国的秋天》的书评
- 约翰·斯卡尔齐(John Scalzi)对“人类分裂”的评论
超越概率和性能
该部分的标题立即刷新。 那些熟悉Mayo的工作的人会知道,她主张对统计推断采用一种常客的观点。 那些熟悉我的工作的人会知道我通常主张贝叶斯的观点。 “概率论”是理解贝叶斯推理的一种方式,而“性能”则是理解贝叶斯推理的一种方式。 贝叶斯传统上对关注绩效持怀疑态度,如果我们愿意接受,Mayo会为我们提供一份和平产品:放任我们对绩效观点的怀疑。 提供和平的代价是愿意反过来怀疑我们自己的概率。
进行这项工作的关键是对元统计原理的依赖:哲学。 我们需要探索关于什么科学证据的直觉。 是什么构成强有力的科学/统计推断? 我们要从统计中得到什么? 在任何特定的统计理论之外回答这个问题都是很重要的,因为“统计战”中的许多战斗都是为了以另一种标准来评估一种统计理论而进行的,因此应该在更高的基础上加以考虑。
Mayo为我们提供了一个可以使用的原则: 严重性。 我认为,她的严厉性原则很弱,几乎没有科学家会反对。
如果没有采取任何措施排除索赔可能是虚假的方式,则没有索赔的证据。
您可能对索赔是正确的,但如果您说有索赔证据 ,则您的责任是表明您已尝试排除可能是虚假的方法。 一项对索赔的良好检验(即严格的检验)是很有可能排除某些错误的东西。 Mayo的严格严重性原则将严格性和严重性联系起来:
我们有索赔的证据……只是在经过严格审查的范围内。
Mayo的立场是,概率和性能目标都无法充分反映严重性观点。 从长期的性能角度来看,任何特定声明的测试都没有做过,并且常客甚至否认这一目标很有趣:他们只想控制总体错误率。 同样,贝叶斯观点着眼于连贯性和从后到前的转变。 在贝叶斯统计中,没有任何形式需要严格性。
这并不意味着采用统计方法的科学家(贝叶斯或常客)不会填补空白。 Mayo引入了“解耦”的思想:方法可以与最初产生它们的哲学脱节。 然后,请我们询问我们的方法如何满足严格测试的要求 ,而不管这些方法是贝叶斯方法,惯常方法还是其他方法。 这似乎是Mayo远离统计战的路线图,她将在巡回赛2中概述这一路线图。