作为最近Minitab统计软件发布的一部分,Minitab将相关图添加到其可视化库中,我想探索为什么这些图对于高级分析来说是如此流行和有用的工具。18luck新利手机版
简而言之,相关图(有时称为相关图或相关矩阵)是相关统计的可视化。它用于评估随机性,并通过快速识别彼此之间具有强相关性的变量来识别数据中的简单模式。与任何数据分析一样,检查和理解数据结构是预测分析过程中重要的第一步,了解变量之间是否高度相关将为下一步提供信息。
而且,正如你将看到的,相关图是一个极好的可视化工具,可以帮助你更好地利用预测分析。
在我们即将举行的网络研讨会上,了解更多Minitab统计软件的最新更新:18luck新利手机版
使用相关图快速确定相关性
你可能会想,“但我用关联矩阵图来评估关联性和随机性。当你只有很少的变量和相对较少的样本数时,将相关性与矩阵图结合使用是很有意义的。
但是让我们举一个工程师为电动汽车设计燃料电池的例子来说明为什么当涉及更多的变量和更多的样本时,相关图是一个强大的工具。
工作温度是影响燃料电池性能的参数之一,以及压力、流量和湿度,对于任何燃料电池设计,必须确定最佳工作温度。为了优化燃料电池的性能和效率设计,工程师需要了解电池中氢气的数量、电池中氧气的数量以及氢气和氧气被推入燃料电池以产生能量的温度之间的关系。
该工程师计划用14个观测值来评估氧和氢之间温度稍高或稍低的化学反应是否会影响燃料电池的功率。
在Minitab中运行相关分析(与Stat Basic Statistics correlation一样简单)后,工程师使用相关表和矩阵图观察本研究中变量之间的相关性。
根据表中的结果,氢含量与功率分钟数之间的皮尔逊相关系数为−0.791,p值为0.001。p值小于显著性水平0.05,表明相关性与0有显著性差异。这种关联意味着,随着氢含量的增加,发电分钟数趋于减少(回想一下,相关性衡量两个变量之间线性关联的强度,范围在-1[强负相关]和+1[强正相关]之间。接近零的相关性表明这两个变量之间没有很强的线性关联。)
矩阵图显示了各个关联,是可视化分析的有用工具。在下面的示例中,请注意功率分钟数和氢含量的曲线图位于左下角。
矩阵图也是识别潜在异常值的有用工具,但它不是为快速识别最强或最弱的相关性而设计的。例如,如果您查看上面的矩阵图,您需要多长时间才能确定哪些相关性最接近-1或+1?
为了快速回答这个问题,相关图是一个更有用的工具,尤其是当你和其他需要一眼就能扫描和理解信息的人一起进行这种类型的分析时。
考虑下面给出的相同的数据是下面的相关图(在MimITAB统计软件:图相关图):18luck新利手机版
你有没有注意到你的眼睛很快就看到了底部深红色的盒子,上面有氧气作用的分钟数?在相关图中,颜色的强度与相关系数成正比,颜色越深表示相关性越强。因此,相关图提供了一个清晰、可扫描的相关性视觉表示。在这种情况下,通过运行相关图,工程师可以轻松地理解数据中的相关性。
使用大量数据的相关图
现在让我们考虑用14个变量和1000行数据进行分析。具体细节无关紧要,这可能是消费者产品调查或电路板工艺测量的结果。如果您要求您的团队在下面的矩阵图中直观地挑选出最强(接近+1或-1)的关联,那么他们需要多长时间来确定最强的关联?
现在看看下面的相关图中显示的相同数据。注意弱相关性是如何在视觉上最小化的,而你的眼睛被吸引到高相关性的区域。想象一下,您的团队识别重要信息的速度会有多快!
了解变量之间的关系,如相关性,是稳健预测分析的关键。虽然在分析变量相对较少的数据时很容易识别相关性,但随着变量数量和数据集大小的增加,理解相关性所需的努力也会增加。通过利用相关图的强大功能,使用Minitab进行统计分析变得更好、更快、更容易–尤其是对于更复杂的问题!