当我们从我们的流程中收集越来越多的观察数据时,我们可能需要新的工具来提供有意义的见解。您可以在传统的统计工具中添加现代机器学习技术,以分析,改进和控制您的流程。让我们来看看一个以二进制逻辑回归开始的示例,并以分类和回归树(Cart®)结尾。
编者说明:在2018年3月发布的索尔福德预测建模者上市的此帖子的早期版本。我们已更新其在最新版本的Minitab中显示购物车。
![]()
找到一个过度变化的根本原因
纸浆漂白过程
在我们的示例中,我们知道我们在2.9%的产品中看到缺陷。要开始查看此过程中这种不可接受的缺陷百分比的根本原因,您可以从二进制逻辑回归开始minitab.响应变量是观察是否有缺陷。不幸的是,对于此数据,下面的残余图中的疯狂模式表明二进制逻辑回归模型可能不足。
购物车接近
大车是一个决策树算法,它通过创建一组是/否规则来基于预测器(x)设置将响应(y)变量拆分为分区中的一组是/否规则。使用Minitab的购物车功能,我认为我的预测变量之一 - 放电pH - 是一个缺陷的大贡献者。
如果放电pH <= 7.739,则缺陷的估计可能性相对较高(17.7%)。如果放电pH> 7.739,则发生很少有缺陷。
进一步阅读:
下面的Minitab图表解释了为什么这条规则有效。购物车型号找到了最佳分隔响应=从响应=失败组的变量和设置。这里,该变量和设置在7.739处放电pH。
我可以继续生长购物车树,最终找到更多的设置组合,导致此过程中的缺陷。一旦我将问题缩小到少数X的问题,我可以控制控制,以减少缺陷的机会。在这种情况下,全推车分类模型识别放电pH和生产速率的一些特定组合,其导致如下图所示的缺陷数量的缺陷。