修剪决策树制作纸质:Minitab预测分析和根本原因分析

Cheryl Pammer.|08年5月,2020年5月

主题:瘦六西格玛回归分析机器学习预测分析DMAIC.Minitab统18luck新利手机版计软件大车分类树木质量改进

当我们从我们的流程中收集越来越多的观察数据时,我们可能需要新的工具来提供有意义的见解。您可以在传统的统计工具中添加现代机器学习技术,以分析,改进和控制您的流程。让我们来看看一个以二进制逻辑回归开始的示例,并以分类和回归树(Cart®)结尾。


编者说明:在2018年3月发布的索尔福德预测建模者上市的此帖子的早期版本。我们已更新其在最新版本的Minitab中显示购物车。
立即介绍:使用Minitab的最新版本提升您的数据专业知识


博客修剪决策树-1-饼图

找到一个过度变化的根本原因
纸浆漂白过程

在我们的示例中,我们知道我们在2.9%的产品中看到缺陷。要开始查看此过程中这种不可接受的缺陷百分比的根本原因,您可以从二进制逻辑回归开始minitab.响应变量是观察是否有缺陷。不幸的是,对于此数据,下面的残余图中的疯狂模式表明二进制逻辑回归模型可能不足。

博客修剪决策树-2-偏差 - 残留块 - 纸浆缺陷

购物车接近

大车是一个决策树算法,它通过创建一组是/否规则来基于预测器(x)设置将响应(y)变量拆分为分区中的一组是/否规则。使用Minitab的购物车功能,我认为我的预测变量之一 - 放电pH - 是一个缺陷的大贡献者。

博客修剪决策树-3-zoom-cart

如果放电pH <= 7.739,则缺陷的估计可能性相对较高(17.7%)。如果放电pH> 7.739,则发生很少有缺陷。

进一步阅读:
深入演练用购物车分析调查数据

下面的Minitab图表解释了为什么这条规则有效。购物车型号找到了最佳分隔响应=从响应=失败组的变量和设置。这里,该变量和设置在7.739处放电pH。

博客修剪决策树-4-图普通 - 推车模型

我可以继续生长购物车树,最终找到更多的设置组合,导致此过程中的缺陷。一旦我将问题缩小到少数X的问题,我可以控制控制,以减少缺陷的机会。在这种情况下,全推车分类模型识别放电pH和生产速率的一些特定组合,其导致如下图所示的缺陷数量的缺陷。

博客修剪决策树-5特定组合 - 图形

准备好看自己?

下载您的免费30天Minitab试用版