假设试验中的显着性水平和P值是什么意思?什么是无论如何统计学意义?在这篇文章中,我将继续专注于概念和图表,以帮助您更直观地了解假设测试如何在统计数据中工作。
要将它带到生命中,我将在我之前的帖子中添加显着性级别和p值,以便执行1个样本T检验的图形版本。当您可以看到真正意味着什么统计学意义时,更容易理解!
这是我们离开的地方我的最后一篇文章。我们希望确定我们的样本意味着(330.6)表明今年的平均能源成本与去年的平均能源成本明显不同260美元。
这概率分布图以上显示样本意味着的分布我们在假设中获得零假设是真的(人口平均值= 260),我们反复制作大量随机样本。
我留下了一个问题:我们在哪里绘制了图表上的统计显着性的线?现在我们将增加重要性水平和P值,这是我们需要的决策工具。
我们将使用这些工具来测试以下假设:
- NULL假设:人口均值等于假设平均值(260)。
- 替代假设:群体的平均不同于假设的平均值(260)。
什么是重要性水平(alpha)?
重要性水平,也表示为alpha或α,是拒绝零假设的概率。例如,显着性水平为0.05表示结论的风险5%,当没有实际差异时,差异存在差异。
由于其技术性,这些类型的定义可能很难理解。一张图片使概念更容易理解!
意义级别决定了零假设值的距离我们将在图表上绘制该行。要绘制显着性水平为0.05,我们需要遮挡最远的分布的5%,这些分布远离零假设。
在上图中,两个阴影区域与空假设值等距,每个区域的概率为0.025,总共0.05。在统计数据中,我们称这些阴影区域关键地区对于双尾测试。如果人口平均值为260,我们希望获得5%的临界区域的示例意味着5%的时间。关键区域定义了我们的样本统计必须从空假设值的距离,因为我们可以说它足以拒绝空假设是不寻常的。
我们的样本意味着(330.6)落在关键区域内,这表明它在0.05级具有统计学意义。
我们还可以看出它是否使用其他常见意义水平为0.01的统计学意义。
两个阴影区域各自具有0.005的概率,其增加到0.01的总概率。这次我们的样本意味着不会落在关键区域内,并且我们无法拒绝零假设。此比较显示为什么在开始学习之前需要选择您的意义水平。它可以保护您选择意义程度,因为它方便地为您提供了重要的结果!
由于该图,我们能够确定我们的结果在0.05级的情况下在不使用P值的情况下在统计学上显着。但是,当您使用产生的数字输出时18luck新利手机版,您需要将P值与重要级别进行比较以进行此确定。
什么是p值?
假设空假设的真实性,p值是在样本数据中至少与样本数据中的一个极端获得效果的概率。
P值的这种定义,虽然在技术上是正确的,有点复杂。用图表理解更容易!
要为我们的示例数据集图进行P值,我们需要确定样本均值和空假设值之间的距离(330.6 - 260 = 70.6)。接下来,我们可以绘制获得至少在分布的两条尾部(260 +/- 70.6)中至少在极端的样本的概率。
在上图中,两个阴影区域各自具有0.01556的概率,总概率0.03112。这种概率表示获得至少与我们的样本在分布的两条尾部的样本中的样本意味着的可能性,如果人口平均值是260。这是我们的P值!
当P值小于或等于显着级别时,拒绝零假设。如果我们为我们的示例进行P值并将其与共同意义级别进行比较,则它匹配先前的图形结果。P值为0.03112在0.05的α水平下具有统计学意义,但不是0.01水平。
如果我们坚持值为0.05的重要性,我们可以得出结论,人口的平均能源成本大于260。
一个常见的错误是将p值解释为null假设是真实的概率。要了解为什么这种解释不正确,请阅读我的博文如何正确解释P值。
讨论统计上显着的结果
假设测试评估关于群体的两个互斥陈述,以确定样本数据最适合哪种陈述。当样本统计数据相对于空假设的样本统计数据不寻常,测试结果是统计学意义的,我们可以拒绝整个人口的零假设。假设测试中的“不寻常”定义:
- 假设NULL假设是真实的 - 图形是以空假设值为中心的。
- 意义程度 - 我们在关键地区绘制线路的距离?
- 我们的样本统计数据 - 它是否属于关键地区?
请记住,没有魔法意义水平,区分具有真实效果的研究和那些不受100%准确性的研究。常见的alpha值为0.05和0.01简单地基于传统。对于0.05的显着性水平,期望在临界区域中获得样品手段5%的时间这null假设是真的。在这些情况下,您不会知道NULL假设是真的,但您将拒绝它,因为样本意味着归属于关键区域。这就是为什么重要性水平也被称为错误速度!
这错误类型并不意味着实验者做错了什么或需要任何其他不寻常的解释。图表表明,当NULL假设是真的时,可以无需除以随机采样误差以外的原因获得这些不寻常的样本意味着。这只是绘画的运气。
意义级别和P值是重要的工具,可帮助您在假设测试中量化和控制此类错误。使用这些工具来决定何时拒绝NULL假设会增加您做出正确决定的机会。
如果您喜欢此帖子,您可能希望阅读此系列中的其他帖子,该帖子使用相同的图形框架:
- 以前的:为什么我们需要使用假设测试
- 下一个:置信区间和置信水平
如果您想了解如何制作这些图形,请阅读:如何创建1样本T检验的图形版本。