在现在提供的网络研讨会上,我在Minitab统计软件中分享了分类和回归树(购物车)的技巧。18luck新利手机版我们探索购物车结果,为某些数据条件进行惩罚,并讨论与您的结果合作的最佳实践。今天,我以为我会给你一个你可以期待的东西。
用于购物车网络研讨会的提示和技巧
什么是分类和回归树(推车)?
CART是一种基于递归分区的建模技术,可用于预测连续和分类响应。这些预测模型提供自动变量选择,易于在Minitab中构建,并且最好的是,该模型可以可视化为易于解释的决策树。在使用大型观察数据集时或在复杂的非线性关系的情况下,推车作为线性或逻辑回归的替代方案是有用的。
提示#1:使用节点拆分视图,以获得最高级别的决策树
大型购物车模型的详细视图可能是一个难以想象的难以想象的,但谢天谢地,Minitab提供了一种选择树的凝聚力的选择。只需右键单击Minitab的购物车型号,然后选择节点拆分视图。此凝聚视图仅显示每次分区时使用的预测器。
提示#2:在工作表中存储购物车预测
当响应或目标变量是连续的时,回归树模型预测每个终端节点中的平均值。对于分类结果变量,预测是每个响应级别的概率,以及预测的响应级别。要以图形方式探索模型在Minitab中使用其他可视化的预测,只需将工作表中的购物车预测存储使用贮存选项。
购物车的相对变量重要性图以重要的顺序显示预测器。这些重要预测因子对响应的影响可以使用Minitab的图形选项来可视化。在下面的示例中,分类模型中的两个最重要的连续预测器用于可视化轮廓图上的响应事件的预测概率。
提示#3:对具有很多缺失值的预测器或具有很多唯一值的分类预测器应用惩罚
具有许多缺失值的连续或分类预测器或具有许多级别的分类预测器可以具有与具有较少级别或没有缺失值的预测器的优势。结果,其中一个预测因子可以“接管”树,掩盖其他预测器的效果。为了解决这些数据条件,Minitab提供了一种选择对具有大量缺失值的预测器或具有很多唯一值的分类预测器来选择惩罚。
可以找到这些处罚通过选项菜单,下面文件>选项。惩罚可以应用于分类或回归树,并且惩罚值范围为0到2,对于缺失值,对于分类预测器0到5(其中0没有罚款,高值分别是最大罚款)。