理解假设检验:置信区间和置信水平

话题:假设检验数据分析18luck 下载

在这一系列帖子中,我展示了假设的测试和置信区间如何通过专注于概念和图形而不是方程和数字来工作。

以前,我用图表说明统计显著性的真正含义。在这篇文章中,我将解释席位间隔和置信水平,以及它们如何与P值和显着性水平密切相关。

如何正确解释置信区间和置信水平

信心水平说明置信区间是可能包含未知种群参数的值范围。如果您多次绘制随机样本,则置信区间的一定比例将包含人口意味着。这个百分比是置信水平。

最常见的情况是,您将使用置信区间来限定均值或标准偏差,但您也可以为回归系数、比例、发生率(Poisson)和总体之间的差异获得置信区间。

就像有一个共同点对如何解释P值的误解,有一个常见的误解如何解释置信区间。在这种情况下,置信水平是特定置信区间包含总体参数的概率。

置信度表示分析产生准确区间的理论能力(如果您能够评估的话)多次间隔你知道人口参数的价值。为一个具体的confidence interval from one study, the interval either contains the population value or it does not—there’s no room for probabilities other than 0 or 1. And you can't choose between these two possibilities because you don’t know the value of the population parameter.

“该参数是一个未知常数,无法对其值作出概率说明。”
-Jerzy Neyman,置信区间的原始开发者。

在我们讨论下面的图表之后,这将更容易理解。。。

记住这一点,怎么你解释了置信区间吗?

置信区间作为人口参数的良好估计,因为该过程倾向于产生包含参数的间隔。置信区间由点估计(最可能的值)和该点估计周围的误差范围组成。误差余量表示包围人口参数样本估计的不确定性。

在这种情况下,您可以使用置信区间来评估样本估计的精度。对于一个特定的变量,较窄的置信区间[90 110]比较宽的置信区间[50 150]更准确地估计总体参数。

置信区间和误差范围

让我们继续看看置信区间是如何解释误差幅度的。为了做到这一点,我们将使用我们一直用来理解假设检验的工具。我将创建一个抽样分布使用概率分布图, 这T分布以及我们数据的可变性。我们将基于置信区间隔能量成本数据集我们一直在使用。

当我们看意义水平,图表显示了以空假设值为中心的采样分布,并且分布的外部5%被阴影。为了置信区间,我们需要改变采样分布,使其以样本为中心,并遮荫中间95%。

说明置信区间如何工作的概率分布图

阴影部分表示95%的情况下样本均值作为总体均值的点估计值样本均值的范围95%的情况下样本均值作为总体均值的点估计值。这个范围[267 394]是我们的95%置信区间。

使用该图形,更容易了解特定置信区间如何代表误差的余量,或者在点估计周围的误差数量或不确定性的数量。样本意味着群体的最可能价值意味着我们的信息。然而,图表表明,对于从相同群体中汲取的其他随机样本来获得在阴影区域内的不同样本装置,它根本不存在。这些其他可能的样本意味着所有人都表明人口的不同价值。因此,该间隔代表了使用样本数据附带的固有的不确定性。

您可以使用这些图来计算特定值的概率。但是,请注意,您无法将人口放在图形上,因为该值未知。因此,正如Neyman所说的那样,您无法计算人口的概率!

为什么P值和置信区间始终达成统计显着性

您可以使用P值或置信区间来确定您的结果是否具有统计学意义。如果一个假设检验同时产生这两种结果,这些结果将会一致。

置信水平相当于1 - α水平。因此,如果您的意义水平为0.05,则相应的置信水平为95%。

  • 如果P值小于您的意义(alpha)水平,则假设测试是统计学意义的。
  • 如果置信区间不包含零假设值,则结果具有统计学意义。
  • 如果P值小于,置信区间将不包含零假设值。

在我们的例子中,P值(0.031)小于显著性水平(0.05),说明我们的结果具有统计学意义。同样,我们的95%置信区间[267 394]不包括零假设均值260,我们得出相同的结论。

要了解结果始终同意的原因,让我们回顾意义程度和置信水平的工作。

  • 显着性水平定义样本意味着必须来自零假设的距离被认为是统计学意义的。
  • 置信度定义了置信度限制与样本均值的距离。

显著性水平和置信水平都定义了从一个极限到一个平均值的距离。你猜怎么着?两种情况下的距离是完全相同的!

距离等于关键T值*标准错误的平均值。对于我们的能源成本示例数据,这个距离计算出来是63.57美元。

想象一下零假设均值和样本均值之间的讨论

零假设均值,假设检验代表: 你好朋友!我发现你有统计学意义,因为你远离我超过63.57美元!

样本意味着,置信区间代表:实际上,我很重要,因为超过63.57美元的距离!!

非常适合他们吗?并且,只要您比较正确的P值和置信区间,它们总是会同意。如果您比较不正确的对,则可以获得突出的结果,如常见错误#1所示帖子

封闭的思想

在统计分析中,往往更关注P值,并简单地检测显著的影响或差异。然而,统计上显著的效果在现实世界中不一定有意义。例如,效果可能太小,没有任何实用价值。

重要的是要注意估计效果的大小和精度。这就是我喜欢置信区间的原因。它们允许你评估这些重要的特征以及统计上的显著性。您希望看到一个狭窄的置信区间,其中整个范围代表一种在现实世界中有意义的效果。

如果你喜欢这篇文章,你可能想要阅读本系列前面的文章,它们使用了相同的图形框架:

有关置信区间的更多信息,请阅读我的帖子将它们与容忍间隔和预测间隔进行比较

如果你想知道我是如何绘制概率分布图的,请阅读:如何创建1个样本t检验的图形化版本

minitab-on-twitter