统计数据中的t值和p值是什么?

话题:假设检验

如果您不是统计学家,查看统计输出有时会让您感觉有点像爱丽丝仙境。突然间,你踏入了一个奇妙的世界,奇怪和神秘的卑微的幻想似乎无处可去。

例如,考虑T-Test结果中的T和P.

“好奇和好奇!”你可能会像Alice一样惊呼,因为你在你的输出中凝视。

一个样本T测试输出

真的是什么值?他们来自哪里?即使您使用的p-value来解释结果的统计显着性UMPTEEN时代,它的实际起源可能对你来说可能会朦胧。

T&P:T-Test的Tweedledee和Tweedledum

t和p不可分割地连接。他们坐在手臂上,就像Tweedledee和Tweedledum一样。这就是为什么。

执行t检验时,通常是寻找总体均值(2个样本t)或总体均值和假设值(1个样本t)之间显著差异的证据。T值测量相对于样本数据的变化的差异的大小。换句话说,T只是以标准误差为单位表示的计算差异。T的大小越大,零假设的证据越大。这意味着有更大的证据表明存在显着差异。越近的T是0,更有可能没有显着差异。

请记住,您输出中的T值是从整个人口的一个样本计算的。它从相同的人口中重复随机数据样本,每次都会得到略微不同的t值,因为随机采样误差(这真的不是任何类型的错误 - 它只是数据中预期的随机变化)。

您可以如何不同于同一人群中许多随机样本的T值?与样品数据的T值如何比较与那些预期的T值相比?

您可以使用T分布来了解。

用t分布来计算概率

为了便于说明,假设您正在使用一个1样本t检验来确定总体均值是否大于假设值,例如5,基于20个观察的样本,如上面的t检验输出所示。

  1. 在Minitab,选择图表>概率分布图
  2. 选择查看概率,然后点击好吧
  3. 分配, 选择T.
  4. 自由程度, 进入19.。(对于1样品T检验,自由度等于样品大小减1)。
  5. 点击阴影区。选择x价值。选择尾巴
  6. x价值,输入2.8(T值),然后单击好吧

分布曲线的最高部分(峰值)向您展示了您希望大多数T值下降的地方。大多数时候,你期望获得接近0的T值。这是有道理的,对吧?因为如果您随机选择从人口中选择代表性样本,则大多数来自人口随机样本的平均值应接近整体群体,使其差异(并且因此计算的T值)接近0。

Minitab-statistical-software-talk-minitab

t值,p值和扑克手

较大的T值(无论是负的或正的)不太可能。分布曲线的最左“尾”和最右“尾”代表t在远离0时获得极值的实例。例如,阴影区域表示获得2.8或更大t值的概率。想象一下,一个神奇的飞镖可以被扔到分布曲线下的任意位置。它降落在阴影区域的几率有多大?计算概率为0.005712.....等于0。006…这是……T.he p-value obtained in the t-test results!

换句话说,当从相同的人群中取样时,获得T值为2.8或更高的概率(这里,具有假假设均值5)的群体约为0.006。

那有多可能?不是特别的!为了比较,在5张牌扑克手中待在5张牌手中进行的概率超过3倍(≈0.021)。

鉴于当从这个人群中抽样时,在从这个人群中抽样时获得T值的可能性是如此之低,更有可能是什么?它更有可能从这个人口中来自这个人群(假设均值为5)。这一样本来自不同人口的可能性更大,一个均值大于5。

Wit:因为p值非常低(

以这种方式,T和P不可分割地连接。考虑到它们在零假设下量化结果的“极端性”的方式。在不改变另一个的情况下,您无法更改一个值。

T值的绝对值越大,p值越小,符合空假设的证据越大。(您可以通过在上面的步骤6中输入T分布的较低和更高的t值来验证这一点)。

试试这个双尾跟进......

上面显示的t分布例子是基于单侧t检验,以确定总体的均值是否大于假设值。因此,t分布的例子显示概率与t值2.8仅在一个方向(分布的右尾部)。

如何使用T分布找到与2.8的T值相关联的p值对于双尾T-test(在两个方向上)?

暗示:在Minitab中,调整步骤5中的选项以找到两个反面的概率。如果你没有Minitab,免费下载30天试用版

Minitab-on-Linkedin