理解假设检验:为什么我们需要在统计学中使用假设检验

主题:假设检验18luck.fyi 18luck 下载

假设检验是统计学中的一个重要步骤。假设检验评估关于总体的两个相互排斥的陈述,以确定哪一个陈述最能得到样本数据的支持。当我们说一项发现具有统计学意义时,这要归功于假设检验。这些测试是如何工作的,统计显著性到底是什么意思?

在这三篇文章的系列文章中,我将通过关注概念和图表而不是方程和数字来帮助您直观地理解假设测试是如何工作的。毕竟,使用的一个关键原因18luck新利手机版就像Minitab一样,这样你就不会陷入计算中,而是可以专注于理解结果。

在这篇文章的开头,我用一个例子来强调使用假设检验的基本原理。

的场景

一位经济学家想确定家庭每月的能源成本是否与前一年相比有所变化,当时每月的平均成本为260美元。《经济学人》随机抽样调查了25个家庭,并记录了他们本年度的能源成本。(本例的数据为:FamilyEnergyCost它只是Minitab数据集库中众多数据集示例中的一个。)

家庭能源费用的描述性统计

我将使用这些描述性统计来创建一个概率分布图,向你们展示假设检验的重要性。继续读下去!

假设检验的必要性

为什么我们需要假设检验?毕竟,我们是随机样本,样本均值330.6不同于260。那不同的,对吧?不幸的是,情况很混乱,因为我们看到的是样本而不是总体。

抽样误差是一个样本与整个总体之间的差值。多亏了抽样误差,我们完全有可能样本均值是330.6,总体均值仍然是260。换句话说,如果重复这个实验,第二个样本均值可能接近260。假设测试有助于评估这种可能性的可能性!

使用抽样分布查看我们的样本平均值是否不太可能

对于任意随机样本,由于抽样误差样本的均值几乎肯定不等于总体的真实均值。对于我们的例子,整个人口的平均成本不太可能恰好是330.6。实际上,如果从同一个总体中随机取多个相同大小的样本,我们可以画出样本均值的分布。

一个抽样分布是一个统计量的分布,例如平均数,它是通过重复从一个特定的总体中抽取大量的样本而得到的。该分布允许您确定获得样本统计量的概率。

幸运的是,我可以在不收集许多不同的随机样本的情况下创建一个样本均值图!相反,我将创建一个概率分布的阴谋使用t分布,样本大小,以及可变性在样本中绘制抽样分布。

我们的目标是确定样本均值是否显著不同于零假设均值。因此,我们用这个图来看看样本均值330.6是否不可能假设总体均值是260。下图显示了样本均值的期望分布。

零假设的抽样分布图

你可以看到最可能的样本均值是260,这是有意义的,因为我们假设零假设是真的。然而,获得样本平均值的合理概率在167到352之间,甚至更高!从这张图中可以看出,虽然我们的样本平均数330.6不是最有可能的,但也不在可能性范围之外。

假设检验的作用

我们把样本均值放在所有可能样本均值的背景下,同时假设零假设成立。这些结果是否具有统计学意义?

正如你所看到的,在分布曲线上没有什么神奇的地方可以做出这个决定。相反,我们得到离零假设值更远的样本均值的概率会不断下降。我们的底线在哪里?

这就是假设检验的用处所在。假设检验允许我们量化样本均值不正常的概率。

在这一系列的文章中,我将继续使用这个图形框架,并添加显著性水平、P值和置信区间,以显示假设检验如何工作以及统计显著性的真正含义。

如果你想知道我是如何制作这些图表的,请阅读:如何创建一个图形版本的1-样本t-Test