预测分析模型一款统计软件统计18luck新利手机版软件在所有行业都是非常有价值的资产。可以通过预测诸如客户流失、患者停留时间、成本、风险、利润和许多其他因素等度量来生成业务价值。
在这篇博客中,我们将研究银行业中的一个应用程序。对于银行来说,向错误的人提供抵押贷款是一个错误,可能会造成数十万美元的损失。考虑到这些利害关系,在决定批准或拒绝他们的抵押贷款申请之前,银行了解他们的客户并对他们做出预测是极其重要的。让我们看看Minitab预测分析通过准确预测哪些客户可能在未来违约,可以最小化抵押贷款违约的数量。
了解按揭资料
以下是分析中使用的观察数据的一部分。对以前的客户抵押贷款有1,645个观察。列C1显示响应变量或目标,如果该人违反其抵押贷款或者如果没有。其他9列包含我们将评估为潜在预测器的功能。
抵押贷款违约的现状
的饼状图下面将帮助我们更好地了解借款人拖欠抵押贷款的比率。我们看到10%的抵押贷款违约。降低这个比例可以大大增加利润。
比较预测模型
为了应对这一挑战,我们期待Minitab预测分析模块.
在本次随需应变网络研讨会中了解更多关于此模块的信息:
由于响应是肯定或否,我们将利用分类模型。如果对连续响应感兴趣,将使用基于树的回归模型。预测分析模块包含三种分类建模类型:
在分类中,评价模型拟合优度的主要指标之一是下面积ROC曲线.这个度量越接近1越好。利用模块中的三个建模引擎,分别比较ROC曲线下面积的值。
树网分类产生的ROC曲线下面积为0.9695。该值优于来自其他两个建模引擎的模型的ROC曲线下面积,这意味着生成的TreeNet分类模型是抵押贷款违约的最佳预测模型。TreeNet梯度助推是Minitab最灵活、获奖和强大的机器学习工具,它能够始终如一地生成极其精确的模型。在这三种建模引擎中,TreeNet通常倾向于产生最好的结果。
可视化的重要变量
让我们先看看相对变重要度图作为模型输出的一部分。相对变量的重要性值从0%到100%,其中最重要的变量总是100%。债务对信用是预测抵押贷款违约最重要的变量,其次是债务对收入,是最重要的变量。在某些情况下,9个功能中的8个对模型是重要的。
对违约概率进行预测
现在我们在Minitab中有了我们的模型,我们可以进行预测了。我们可以在Minitab中输入单个值来预测,或者输入一列值,如果一次做出更大数量的预测是有价值的。
我们有一名申请485,000元按揭的个人资料:
- 43岁
- 81000美元的收入
- 9个信用来源
- 债务信贷比率为0.68
- 债务收入比率为0.73
- 住宅抵押贷款
- 来自西北地区
- 没有家属
我们将这些值输入预测模型,以获得个体默认的概率,如下面的预测输出所示。这个人抵押贷款违约的概率超过97%一旦做出预测,那么你,一个有行业知识的人,就可以解释预测并采取行动。我认为有97%违约概率的个人很可能会被拒绝抵押贷款。
在可用所有预测器的值可用时进行预测始终是最佳情况场景,但在缺少预测器的某些值时,现实情况下有很多次。Minitab的预测分析使我们在发生这种情况时仍然可以进行预测。在下面的示例中,有几个缺失值。即使使用缺失的值,我们仍然可以获得对抵押贷款的概率的预测。
我们还有一个潜在客户申请了37.5万美元的抵押贷款。我们没有关于该申请人的收入、债务收入比、地区和家属人数的数据。我们有以下信息:
- 年龄49岁
- 4信贷来源
- 债务信贷比率为0.31
- 住宅抵押贷款
尽管缺少这些值,我们仍然能够做出预测,并看到这个客户违约的概率小于1%,如belo所示w。
根据分析,这个人看起来是抵押贷款的好候选人,因为根据预测模型,他们违约的概率小于1%。这只是Minitab如何基于树的机器学习算法可以帮助你解决复杂的问题,并获得有价值的见解。