一般来说,如果你是一名化学工程师,你可能正在开发和设计化学制造工艺。与其他工程师不同,这意味着您可能需要应用化学、生物学、物理学和数学原理来解决涉及化学品、燃料、药物、食品和许多其他产品的生产或使用的问题。所有这些时间都花在了科学上,如果你没有像你希望的那样花那么多时间在统计上,别担心,Minitab就在这里!现在,让我们谈谈原因方差分析(ANOVA)可能是化学工程师的秘密武器。
为什么你应该知道方差分析
许多工业应用涉及实验,目标是了解组是否不同。在统计上,我们考虑一个因素-让我们说催化剂类型-我们想了解,如果水平其中一个因素——催化剂1、催化剂2、催化剂3和催化剂4——在统计上彼此显著不同以及其他一些假设我们使用方差分析比较各组的平均值。从某种意义上说,“方差分析”这个名称用词不当,因为我们对比较各组的平均值感兴趣。然而,通过分析组内和组间数据的差异,我们可以确定组内平均值是否在统计上不同。
了解更多可视化以及可以让您的见解易于分享和理解的图表!
方差分析检验无效假设总体平均值(用符号µ表示)均等于L我们将使用样本平均数估计总体平均数。如果这个无效假设被拒绝,那么我们得出结论,总体平均数并不都相等。
无效假设:
何:µ催化剂1= µ催化剂2= µ催化剂3= µ催化剂4
简单地说,我们假设各组的平均值都是相等的,我们收集证据来证明这一点,即如果我们观察到这些平均值之间存在较大的平均值差异,我们更有可能拒绝这一信念,并假设组内水平存在差异。
单向方差分析示例
想象一下,一位化学工程师想要比较使用四种不同催化剂的产品收率。她用产品加热催化剂以进行反应。使用方差分析,工程师可以确定使用不同催化剂的产品产量是否存在显著差异。
首先,工程师收集数据,如下所示。
接下来,工程师运行一个单因素方差分析.
这个p值对于产品产量,方差分析很小,表明如果零假设成立,即催化剂平均值都相等,我们观察这些结果的可能性很小。因为p值小于5%的显著性水平(我们使用的是α=0.05),所以我们拒绝了无效假设。我们得出的结论是,不同催化剂组的平均产物产率不同。
工程师知道这一点一些组的平均值是不同的。下一个逻辑问题是,哪一个?
使用Tukey的方法进行多重比较
虽然方差分析告诉我们,组中的一些方法是不同的,但工程师需要更深入的比较才能理解哪一个组的意思是不同的。Minitab为此提供了“比较”。在我们的示例中,化学工程师使用Tukey比较正式测试各组之间的差异,了解哪些组在统计上有显著差异。
Tukey的多重比较测试是几种测试中最保守的测试,这些测试可用于确定一组平均值中哪些与其他不同。Tukey的方法是在ANOVA之后使用的(这就是为什么你会听到这种方法被称为事后并可用于为因子水平均值之间的所有成对差异创建置信区间,同时将族错误率控制在您指定的水平。
在我们的示例中,包含Tukey同时置信区间的图表显示,催化剂2和4的平均值之间的差异的置信区间为3.114到15.886。该范围不包括零,这表明这些平均值之间的差异是显著的。工程师可使用该差异估计值来确定差异是否具有实际意义。
相反,剩余平均数对的置信区间均包括零,这表明差异不显著。
为什么不做一系列的t检验来识别差异呢?
这是一个很好的问题,而且会出现很多问题!答案与犯错误的风险有关,特别是错误地认为存在统计显著差异的风险,这就是我们所说的阿尔法风险。当我们进行一次测试时,有5%的机会我们会说存在差异,而实际上存在差异不是。对于4个催化剂,这将导致6个t测试!
仅仅由于偶然的机会,至少观察到一个重要结果的概率是多少?
P(至少一个有效结果)=1− P(无显著结果)
= 1 − (1 − 0.05)6.
≈ 0.264
因此,考虑到6个测试,我们有26%的机会观察到至少一个显著结果,即使所有测试实际上都不显著。事后测试控制实验错误率;更简单地说,我们希望确保我们错误声明任何一对催化剂不同的机会保持在5%。也就是说这正是Tukey的测试为我们做的!
答案是方差分析
使用方差分析可以让化学工程师测试混合物,看看结果是否具有统计学意义。同样重要的是,她还可以通过比较测试确定整个群体是否不同,或者可能只是群体的一个子群体。在我们的示例中,只有催化剂2和催化剂4在产品收率方面存在统计上的显著差异。基于此信息,化学工程师可能会开始查看其他催化剂,以确定哪种催化剂最具成本效益、保质期最长,或者最容易获得,因为知道它将产生类似数量的产品。