该表是一场彻底的灾难。
乍一看就发现7/8%的变化没有任何意义。
(.054-.018)/。018 * 100 = 200.0%,他们报告的为99.0%
(.073-.021)/。021 * 100 = 247.6%,他们报告的是109.4%
(.033-.002)/。002 * 100 = 1550.0%,他们报告了176.9%
(.062-.086)/。086 * 100 = -27.9%,他们报告为-16.2%
(.018-.120)/。120 * 100 = -85.0%,他们报告为-73.3%
(.099-.047)/。047 * 100 = 110.6%,他们报告了35.7%
(.046-.030)/。030 * 100 = 53.3%,他们报告为41.5%
附录20170216的附录
通过电子邮件讨论和在Facebook上的热烈讨论,我现在可以确定如何计算此表中的百分比变化。
这是一个好事,我们开始。
作者没有使用百分比变化公式,而是在使用百分比差异 公式 。
百分比差异公式将重现第一列值,但不会重现第二列值。 如果您的两个百分比都为正,则不可能使用百分比差异公式获得负结果。
百分比变化的第二列的前两行使用以下公式计算:
差异百分比* -0.5
百分比变化第二列的第三行计算如下:
差异百分比* 0.5
百分比变化第二列的第四行仅是百分比差异。
因此,第一个“%变化”列标签应显示“%差异”,第二个“%变化”列标签应显示“ WTF”。 我还担心百分比差异是否应在 此处 使用 。 我的其他批评仍然存在。
这张桌子的问题还远远没有解决。
突出的一件事是“所有热蔬菜”的分数不是每列中的最大值。 如果您假设每天不食用每种蔬菜,这实际上是可以解释的。 例如,如果仅在70%的时间里放送诸如西兰花之类的流行蔬菜,您就可以轻松获得其报告的数字。
他们报告的标准偏差无法解释。
之前,我曾对方差和标准差进行过历史性的发现,因此我是标准差的鉴赏家。
跳出来的第一件事是标准偏差远大于分数。 起初我以为他们可能会每天提取分数(每个单元格有20天),然后发现这20个值的标准差。 但在表格下方清楚地指出:“每个儿童日都被视为一个观察日。”
嗯,好的,那么如何得到一个分数的标准偏差? 当您有分数时,即记录两个可能的结果时,基本上就是二项分布。
维基百科告诉我们二项分布的方差为:
Var(X)= n * p *(1-p)
其中n是试验次数,p是概率。
但这是计数的方差。 我们对分数的方差感兴趣。 要将计数转换为分数,只需除以n。
我们正在寻找的是:
无功(X / n)
维基百科告诉我们:
Var(a * X)=a²* Var(X)
甜。 因此,我们要做的就是将方差除以n²。 为了获得标准偏差,我们只求方差的平方根即可。
好吧,那n是什么? 当然,他们不会告诉我们每个单元格的n。
他们在书中说:“研究包括总共40,778个儿童日观察,其中大约一半在治疗组中”。 因此,我想我们可以假设每个单元格大约有10,000个观测值,因为每个组中有两个月的观测时间,尽管如上所述,似乎并不是每天都提供每种蔬菜,所以底部3行的观测值数量可能更少大于10,000,实际上,对于任何分数,某些行的观测值必须比第一行少。
使用此公式:
SD =根(Var(X / n))=根(n /n²* p *(1-p))=根(1 / n * p *(1-p))
在n = 10,000的情况下,我们可以证明报告的标准偏差相差100倍!
让我再说一遍。 减100倍!
我们假设n为10,000的事实,碰巧提供的数字比其数字小100倍,因此很容易看到它们所犯的错误。 显然,他们使用以下公式计算标准差:
根(p *(1-p))
该公式复制了他们所有的食言动物,除了对照组第2个月的西兰花。 此处报告的分数为0.018,第一列和第一行报告的分数相同,但SD却不同。 他们甚至无法一致地报告错误计算的值。
也许对他们来说方便,它们的值大约减少了100,从理论上讲,它们可以使标准偏差为百分比而不是分数的标准偏差。 但是,正如我之前所说,各行必须具有不同的样本大小才能使分数有意义,因此,SD不应始终比10,000的SD获得的SD大100倍。
不幸的是,我们还没有完成。 有趣的是,它们将所有百分比变化标记为具有统计意义的变化(最后一行除外)。 他们指出:“显着性是基于百分比差异的F统计量”。
我不太确定他们使用的是什么统计检验,但是您会认为,每组样本量约为10,000,任何差异在统计上都是显着的。 我进行了一些模拟,无论它们使用什么测试,最后一行的变化似乎在统计上都非常明显。 它们可能不重要的唯一方法是,如果样本大小实际上没有那么大,只有在很少提供胡萝卜的情况下,这种情况才会发生。
附录20170220
通过电子邮件讨论后,我现在知道报告的标准偏差的另一种可能解释。 因为解释的时间足够长,值得推荐自己的博客文章,所以我已在文章末尾发布了它。