使用Minitab预测分析模块预测抵押贷款违约

汤姆威廉姆斯|2021年9月30日,

主题:银行业和金融业一款统计软件统计18luck新利手机版软件

预测分析模型一款统计软件统计18luck新利手机版软件在所有行业都是非常有价值的资产。可以通过预测诸如客户流失、患者停留时间、成本、风险、利润和许多其他因素等度量来生成业务价值。

在这篇博客中,我们将研究银行业中的一个应用程序。对于银行来说,向错误的人提供抵押贷款是一个错误,可能会造成数十万美元的损失。考虑到这些利害关系,在决定批准或拒绝他们的抵押贷款申请之前,银行了解他们的客户并对他们做出预测是极其重要的。让我们看看Minitab预测分析通过准确预测哪些客户可能在未来违约,可以最小化抵押贷款违约的数量。

了解按揭资料

以下是分析中使用的观察数据的一部分。对以前的客户抵押贷款有1,645个观察。列C1显示响应变量或目标,如果该人违反其抵押贷款或者如果没有。其他9列包含我们将评估为潜在预测器的功能。

观测数据

抵押贷款违约的现状

饼状图下面将帮助我们更好地了解借款人拖欠抵押贷款的比率。我们看到10%的抵押贷款违约。降低这个比例可以大大增加利润。

抵押贷款违约

比较预测模型

为了应对这一挑战,我们期待Minitab预测分析模块

在本次随需应变网络研讨会中了解更多关于此模块的信息:

提高你的预测分析技能

由于响应是肯定或否,我们将利用分类模型。如果对连续响应感兴趣,将使用基于树的回归模型。预测分析模块包含三种分类建模类型:

  1. ®分类
  2. 随机森林分类
  3. TreeNet分类

在分类中,评价模型拟合优度的主要指标之一是下面积ROC曲线.这个度量越接近1越好。利用模块中的三个建模引擎,分别比较ROC曲线下面积的值。

树网分类产生的ROC曲线下面积为0.9695。该值优于来自其他两个建模引擎的模型的ROC曲线下面积,这意味着生成的TreeNet分类模型是抵押贷款违约的最佳预测模型。TreeNet梯度助推是Minitab最灵活、获奖和强大的机器学习工具,它能够始终如一地生成极其精确的模型。在这三种建模引擎中,TreeNet通常倾向于产生最好的结果。

可视化的重要变量

让我们先看看相对变重要度图作为模型输出的一部分。相对变量的重要性值从0%到100%,其中最重要的变量总是100%。债务对信用是预测抵押贷款违约最重要的变量,其次是债务对收入,是最重要的变量。在某些情况下,9个功能中的8个对模型是重要的。

对违约概率进行预测

现在我们在Minitab中有了我们的模型,我们可以进行预测了。我们可以在Minitab中输入单个值来预测,或者输入一列值,如果一次做出更大数量的预测是有价值的。

我们有一名申请485,000元按揭的个人资料:

  • 43岁
  • 81000美元的收入
  • 9个信用来源
  • 债务信贷比率为0.68
  • 债务收入比率为0.73
  • 住宅抵押贷款
  • 来自西北地区
  • 没有家属

我们将这些值输入预测模型,以获得个体默认的概率,如下面的预测输出所示。这个人抵押贷款违约的概率超过97%一旦做出预测,那么你,一个有行业知识的人,就可以解释预测并采取行动。我认为有97%违约概率的个人很可能会被拒绝抵押贷款。

预测模型(7)

在可用所有预测器的值可用时进行预测始终是最佳情况场景,但在缺少预测器的某些值时,现实情况下有很多次。Minitab的预测分析使我们在发生这种情况时仍然可以进行预测。在下面的示例中,有几个缺失值。即使使用缺失的值,我们仍然可以获得对抵押贷款的概率的预测。

我们还有一个潜在客户申请了37.5万美元的抵押贷款。我们没有关于该申请人的收入、债务收入比、地区和家属人数的数据。我们有以下信息:

  • 年龄49岁
  • 4信贷来源
  • 债务信贷比率为0.31
  • 住宅抵押贷款

尽管缺少这些值,我们仍然能够做出预测,并看到这个客户违约的概率小于1%,如belo所示w。

预测违约

根据分析,这个人看起来是抵押贷款的好候选人,因为根据预测模型,他们违约的概率小于1%。这只是Minitab如何基于树的机器学习算法可以帮助你解决复杂的问题,并获得有价值的见解。

了解如何在您的行业中应用Minitab预测分析模块的电源

找一款统计软件