方差分析与ANOM的棒球公园之战

科迪·斯蒂尔|2021年10月21日

话题:方差分析,预测分析

现在我们正处在10月,美国职棒大联盟剩下的球队正在为参加世界职业棒球大赛而斗争。对于棒球迷来说,这是一个激动人心的时刻,作为一个对统计数据同样激动的人,我想不出还有比这更好的时间来分析一些棒球数据了!在这个博客中,我将区分两个密切相关的分析Minitab统18luck新利手机版计软件简化:方差分析(方差分析)及手段分析(ANOM)我将通过回答“哪些棒球场更适合打者,哪些棒球场更适合投手”来说明这两种分析之间的差异

我的数据来源于ESPN的MLB公园因素它涵盖了2001年到今天。首先,让我解释一下为什么这种分析需要一些注意事项:

  • 我向白袜队、小熊队和田径队的球迷道歉,因为我忽略了这些球队的公园。ESPN的数据没有说芝加哥的哪个公园是哪个。
  • 田径队只有两年的数据,尽管他们自60年代以来一直在同一个体育场比赛。
  • ESPN为不同类型的热门节目提供了公园因子,因此我们可以利用这些数据来确定最佳单打公园、最佳本垒打公园等等。我将只使用基于每个公园得分次数的数据。

方差分析和方差分析的旁注

在我们开始之前,这里有一些事情需要注意:ANOVA和ANOM是使用随机抽样将样本结果推广到更大的总体。假设逐年的数据代表一个随机样本是一种延伸,所以不要把这种分析当作严肃的推论。结果仍然有助于显示两种不同分析所回答问题的差异。

准备好提升您的分析技能并将您的数据专业技能提升到新的水平了吗?

观看预测分析网络研讨会

这个无效假设对于方差分析,比较组的平均值彼此相等。方差分析通常包括多重比较。多重比较着眼于各组均值之间的差异,以确定哪些均值在统计上存在差异以及差异程度。

ANOM的无效假设是所有组平均值等于所有数据的平均值。如果ANOM的零假设为真,则ANOVA的零假设也为真。只有当我们拒绝无效假设时,我们才能发现分析目标的差异。

球场分析#1使用单向方差分析

对于第一个分析,我将使用单向方差分析测试。通过选择特定的兴趣比较,我们可以更深入地进行这种分析。在这里,我们将所有公园与得分最低的公园进行比较:Petco公园。

想跟上吗?下面是一个Minitab 20.4项目,其中包含我分析的数据集。这个数据集很特别,因为我在公园名称之前添加了公园因子排名。这意味着当Minitab按字母顺序排列结果中的公园名称时,公园的顺序是从最小的公园因子到最大的公园因子。

  1. 选择统计>方差分析>单向.
  2. 在里面响应进来.
  3. 在里面因素,输入“公园名称'.
  4. 点击比较.
  5. 选择徐小川.
  6. 在里面最好的,选择最小的是最好的.
  7. 点击好吧在每个对话框中.

徐慈

上面的结果显示哪些公园比Petco公园更适合打者的公园。这份名单包括19个公园,其中最著名的是丹佛的库尔斯公园。丹佛的海拔高度以创造有利于打者的环境而闻名。

这个方差分析信息非常有用。我们可以看到比Petco公园更好的打者公园,以及哪些公园与Petco公园没有区别。如果我们进行不同的多重比较,我们可以将每个公园与其他公园进行比较,或者将每个公园与单个选定的公园进行比较。小组之间的差异是主要焦点。使用ANOM,我们回答一个不同的问题。如果我们想将球场分为打者球场、中立球场和投手球场,该怎么办?

图上的点是平均公园因子。中心线代表总体平均值。外线是决策界限,表明哪些公园与总体平均值不同。

使用Minitab统计软件进行30天试验:18luck新利手机版

免费试用Minitab

球场分析#2使用anom

回想一下,ANOM不是测试平均值是否相等,而是测试平均值是否相等等于总均值。Minitab制作了一个图表,这样结果就容易理解了。您可以使用相同的数据集遵循以下步骤来获得结果:

  1. 选择统计>方差分析>均值分析.
  2. 在里面响应进来.
  3. 在下面典型的在里面因子1进来公园的名字.
  4. 点击好吧.
anom为运行图上的点是公园因子的平均值。这个中心直线代表总体平均值。这个线是决定界限,显示哪些公园与总体平均值不同。

这个数据包含了7个投手的球场: 和4个打者公园:
  1. Petco公园
  2. T-Mobile公园
  3. 花旗球场
  4. 马林鱼公园
  5. 道奇体育场
  6. 热带油田
  7. 甲骨文公园
  1. 库尔斯球场
  2. 全球生活公园
  3. 芬威球场
  4. 追逐场

统计分析改善决策

使用能够为应用程序回答正确问题的分析是做出正确决策的关键。注意方差分析和ANOM之间的区别。

在方差分析中,我们得到了两个类别:

  • 与Petco公园无法区分
  • 对打者来说比在Petco公园更好

对于ANOM,我们有三个类别:

  • 低于整体平均值
  • 与总体平均值不可区分
  • 高于整体平均值

请注意,分类中也有不同之处。在方差分析中,Busch体育场和Petco公园没有什么区别,所以我们倾向于认为它是一个有利于投手的公园。在ANOM的分析中,Busch体育场与总体平均值没有区别,所以我们可以把它看作是一个中立的跑步公园。在方差分析中,我们看到19个公园比Petco公园更适合打者。在ANOM分析中,我们看到4个击球手的击球次数比整体的平均次数要多。

要深入了解分析的威力,请阅读以下相关博客:

理解预测性分析的重要性

ANOM的Sahlen Field案例很有趣。萨伦球场有一个平均值,使它看起来像一个击球手的公园,但它不是分类为一个击球手的公园统计。多伦多蓝鸟队只在那里打了两个赛季。如果这些数据是随机样本,我们会看到,数据的变化太大,样本太小,无法提供统计证据,萨伦球场将永远是一个打击者的公园。一组内平均值与变异数之间的差异之间的关系是使用考虑数据变异的统计分析的一个重要好处。

像方差分析和ANOM这样的统计分析提供了我们需要从数据中做出更好的决定的见解——在这个例子中,是棒球公园。在你自己的生活中,在几乎每个行业的每个角色中,你都可以通过很多方式利用比较小组的结果来更好地做出决策。要看另一个比较组的结果,看看如何河景医院协会确定了特定的患者群体与其他组相比,该组的满意度得分较低,因此协会可以正确指导他们的改进过程。