使用Minitab预测分析模块分析比特币数据

米哈伊尔·Golovnya|4月30日,2021年4月30日

话题:预测分析Minitab统18luck新利手机版计软件

随着比特币的普及不断增加,越来越多的分析师正试图了解对这种现象的更好理解。虽然可能很难做出对实际比特币价格的准确预测,但仍有可能识别一些有趣的趋势和关系。在下面的情况下,我将演示如何使用Minitab预测分析模块来完成此任务。

了解我们的按需网络研讨会中的Minitab预测分析模块:
现在看

许多公共来源都可以获得实际比特币数据。可以下载一个非常有用的数据集在这里

该数据集包括从2009年开始每天的比特币统计数据。每一天都被44个不同的指标总结,包括比特币价格、各种费用、区块数、交易数、投资回报等等。可以查阅整个数据字典在这里

为了便于分析,我将查看从2015年1月1日到2021年4月20日的比特币每日统计数据。这就消除了一些可能影响最近趋势的早期历史。数据集包括一个称为ROI30d的变量——假设在30天前购买资产,则该资产的投资回报率为百分比。在接下来的工作中,我的主要目标是用剩下的变量作为潜在的预测变量,对30天的投资回报做出准确的预测。

数据摘要

首先,让我快速查看使用Minitab的各种数据摘要。

以下是30天投资回报率的时间序列情节:

比特币博客图片1

正如你所看到的,投资比特币可以带来丰厚的回报,也可以带来巨大的损失。鉴于这种资产的波动性,投资比特币的时机对回报至关重要。因此,了解对回报的影响有助于确定何时是最佳投资时机。

确定最重要的预测因子

因此,我们经常被问到问题,并需要在最短的时间内提出最佳答案。有44个可能的预测因子,我需要知道最重要的事情,我需要快速了解它,所以我可以运行分析。

这就是为什么Minitab预测分析模块有一个选项叫做“发现关键预测器”。这个选项允许我让软件识别最重要的变量,使我能够建立一个仍然高度精确的模型,但远不那么复杂,使它更加用户友好。

我拍摄数据集并通过TREENET“发现密钥预测器”运行。正如预期的那样,Minitab从提供的一组候选预测器组开始,并通过按顺序构建一系列模型来进行,并且通过丢弃最不重要的变量,每个后续模型使用一个更少的预测器。因此,整个过程是从经典回归建模中已知的倒退消除过程的现代推广。以下是当我从完整的预测器组开始时会发生什么(不包括日期):

比特币博客图片2

查看我可能的模型的图形可视化,您可以看到模型精度波动约90%,直到只留下两个预测器。当我挖掘分析时,“发现关键预测因子”揭示了AsseteodCompletionTime是“最后一个人站立”或最重要的预测因素。

不幸的是,从数据字典中查找定义,这个“预测器”只是每天收集最后一个数据的时间,这不是一个有用的度量。结果,我想消除这一点,因为我知道 - 肯定地 - 这些可能是相关的,但没有预测。预测测量选择中并不罕见:通常机器首先选择一堆无用的玩家。此示例还强调了将预测分析与主题专业知识配对的重要性。幸运的是,解决方案很简单 - 只需将其从变量的起始列表中删除并重做“发现最佳预测因子”分析!

从原始列表中删除AssetEODCompletionTime并重新启动预测器发现过程后,我获得了以下摘要:

比特币博客图片3

请注意,Minitab的发动机突出显示最佳模型使用8个原始变量(指标),并在50%的测试分区上实现91%R-Squared。这是这种类型的回归模型的优异性能结果!另请注意,模型表现统计变化率约为90%。

Minitab还为我提供了有益的可视化,即当预测器的数量低于3时,模型的整体精度只会显着降低3.为了构建最简单的模型,同时最大限度地提高精度,可以选择一个带有3个预测器的模型,以进行更详细的分析。或者,您可以从原始候选列表中删除这些变量中的一些变量,并重做最佳预测器搜索以识别不同的获奖者子集。请记住,在这个例子中,我正试图迅速识别重要的事情。如果最高精度是您的目标,则可能会使用最佳模型。机会是无穷无尽的,无论你的目标是什么,你都可以轻松完成几下面!

建模见解

回到我的例子。我现在将仔细看看上面选择的3变量模型。以下是此模型的摘要性能:

比特币博客图片4

正如你所看到的,我们在50%的测试样本上有88%+的准确性-一个非常好的结果!此外,Minitab还根据这三种幸存参数对该模型的整体贡献报告了它们的相对排名:

比特币博客图片5

与3天投资回报相关的最重要的变量是CapMVRVCur。结果表明,这个变量总结了市场可能的高估/低估。这是这个变量在过去6年的时间序列图:

比特币博客图片6

看来,这种度量往往会在1.0和4.0之间波动,电流值约为3.3并可能减少。这是关于该度量的更详细的描述数据词典

创建这个比率背后的直觉是,用已实现资本化(见资本化,已实现,USD)代表的“基本面”除以价格函数。这给了您一个比率,它潜在地指示了估值过高(当网络价值远远超过其与已实现的市值的历史关系)和估值过低的时期。已实现的上限是一个强有力的基础,因为它可以被理解为持有人在给定时间的平均成本基础,所以两者的比率表明持有人是否处于水下,从而洞察总体情绪。

TreeNet渐变促进模型还揭示了这种指标对30天投资回报的贡献性质:

比特币博客图片7

回想一下,该指标的最新值在3.3左右波动,并可能继续下降。从上面的依赖关系图可以清楚地看出,如果情况确实如此,那么我们预计3天ROI将继续下降。或者,如果有任何理由相信这个指标将增加到3.7或以上,我们可能会期待一个显著的ROI跳跃,基于历史模式。

以上一系列步骤模拟了预测分析中遇到的典型场景。我们从一个包含44个变量的数据集开始,并在几分钟内迅速找到了最重要的预测因素。关键预测器选择创建了一个捷径,避免了每次只查看一个变量的冗长和费力的过程。此外,TreeNet梯度增强模型显示出了极高的准确性。所有这些都突出了现代预测分析的力量,并说明了为什么您需要它向前发展!

感受到在Minitab统计软件中运行自己的预测分析吗?18luck新利手机版
开始你的免费试用