什么是方差分析?谁喝的啤酒最多?

话题:假设检验,18luck.fyi ,18luck 下载

当我还是一名统计学本科生时,不幸的是,我花了整整一个学期的时间上一门课,用我的TI-82勤奋地计算数字,然后才意识到1)我实际上在上方差分析(ANOVA)课,2)为什么我首先要使用这样一个工具,3)方差分析不一定能告诉你任何关于方差的事情。

幸运的是,从那以后,我有了更多的现实经验可以借鉴,这使得今天的理解变得更加容易。不需要TI-82。

为什么要进行方差分析?

具体地说,在最简单的形式中,一个单因素方差分析可以取1个连续(“响应”)变量和1个分类(“因子”)变量,并检验分类变量的所有组平均值相等的无效假设。通常,我们讨论的是至少3个组,因为如果只有2个组(示例),那么可以使用双样本t检验同时跳过方差分析。

作为一个例子,让我们看看平均年人均啤酒消费跨越世界三大区域:亚洲、欧洲和美洲。以下是无效和替代假设:

H0:所有地区平均饮用相同数量的啤酒(μ亚洲= μ欧洲= μ美国)

H1.:并非所有地区平均喝啤酒量相同

猜猜谁喝的啤酒最多?

根据使用Minitab统18luck新利手机版计软件,欧洲平均啤酒消费量最多,亚洲最少。然而,这些差异是否具有统计学意义?或者这些差异仅仅是随机变化造成的?

方差分析的工作原理

方差分析背后的基本逻辑是,组内变异仅由随机误差引起。因此:

  • 如果组间变异与组内变异相似,则组平均值可能仅因随机误差而不同。(图1)
  • 如果组间差异相对于组内差异较大,则组间均值可能存在差异。(图2)

说什么?

在我们的示例中,组间变化表示变化之间三个不同的地区。组内变异代表啤酒消费的变异性在内部一个给定的区域。以欧洲为例,我们有捷克共和国。它似乎是世界上最渴的国家,啤酒消费量最多,达到148.6升。但欧洲也包括意大利,意大利人口的饮料量至少只有29升(也许意大利人为了一些葡萄酒和柠檬酒而放弃了佩罗尼?)。因此,你可以看到,欧洲集团内部存在差异。亚洲集团和美国集团内部也存在差异。

通过方差分析,我们将组间差异(即亚洲与欧洲与美洲)与组内差异(即每个区域内)进行比较。该比率越高,p值越小。所以术语ANOVA指的是我们利用方差信息得出均值结论的事实。

分析

如果我们使用此啤酒数据运行单因素方差分析,Minitab统计软件将在会话窗口中提供以下输出:18luck新利手机版

我们的p值在统计学上显著性为0.000。因此,我们可以拒绝所有地区平均喝啤酒量相同的无效假设。

这就引出了我们的下一个问题:哪些国家不同?让我们使用Tukey多重比较来找出答案。

根据Tukey比较图上的脚注,“如果区间不包含零,则相应的平均值显著不同。”因此,红色显示的区间告诉我们差异在哪里。具体而言,我们可以得出结论,欧洲的平均啤酒消费量明显高于亚洲。我们还可以得出结论,美国的消费量远远超过亚洲。然而,没有足够的证据表明欧洲的平均啤酒消费量与美国不同。

最后一口

虽然您不太可能在您的专业生涯中分析啤酒数据,但我希望这能够对ANOVA提供一点洞察力,以及如何利用它来测试3个或更多组之间的平均值。