预测分析
预测分析是先进的分析使用新的和历史数据来预测活动,行为和趋势。它涉及申请统计分析数据集的技术,分析查询和自动化机器学习算法创建预测模型那个地方值 - 或分数——表示某一特定事件发生的可能性。
预测分析软件应用程序使用可以测量和分析的变量来预测个人、机器或其他实体的可能行为。预测分析可以用于用例的多样性。例如,保险公司在定价和发放汽车保险单时,可能会考虑潜在的驾驶安全变量,如年龄、性别、地点、车辆类型和驾驶记录。
将多个变量组合成一个能够以可接受的可靠性水平评估未来概率的预测模型。该软件严重依赖先进的算法和方法,比如逻辑回归模型,时间序列分析和决策树。
预测分析随着大数据系统。随着企业在Hadoop集群和其他大数据平台上积累了越来越大、越来越广泛的数据池,它们创造了越来越多的数据挖掘机会,以获得预测洞察力。IT厂商对机器学习工具的高度开发和商业化也有助于扩展预测分析能力。
市场营销、金融服务和保险公司都得到了好评显著的用户预测分析,具有大型搜索引擎和在线服务提供商。预测性分析也常用于医疗保健,零售和制造等行业。
预测分析的商业应用程序包括定位在线广告、分析客户行为以确定购买模式、标记潜在的欺诈性金融交易、识别有发展特定医疗状况风险的病人,并在工业设备发生部件故障前检测出即将发生的故障。
预测分析过程和技术
预测分析需要具有统计方法和构建预测数据模型能力的高级专业知识。因此,它通常处于数据科学家统计人员和其他熟练的数据分析人员。他们支持的数据工程师他们帮助收集相关数据并为分析做准备,软件开发人员和业务分析人员则提供帮助数据可视化,仪表板和报告。
数据科学家使用预测模型来寻找相关性在网站点击数据中的不同数据元素之间,患者健康记录和其他类型的数据集。发生数据收集后,根据需要,制定统计模型,培训和修改以产生准确的结果。然后将模型与所选数据运行以生成预测。在某些应用中分析完整数据集,但在其他应用程序中,分析团队使用数据采集简化流程。当其他信息可用时,将验证或修改数据建模。
预测分析过程并不总是线性的,相关性往往会出现在数据科学家没有注意到的地方。出于这个原因,一些企业正在招聘拥有物理和其他硬科学学科学术背景的人来填补数据科学家的职位。在遵循科学方法的前提下,这些工作人员很乐意按照数据指引的方向去做。即使企业遵循更传统的方式,聘用受过数学、统计学和计算机科学培训的数据科学家,但对数据探索持开放态度是有效预测分析的关键属性。
一旦预测建模产生了可操作的结果,分析团队就可以与业务主管共享这些结果,通常借助仪表板和报告,这些仪表板和报告显示了这些信息,并根据这些发现突出了未来的业务机会。功能模型还可以构建到操作应用程序和数据产品中,以提供实时分析功能,例如推荐引擎在一个在线零售网站上,根据顾客的浏览活动和购买选择指向特定的产品。
除了数据建模,数据科学家和从事预测分析的专家使用的其他技术可能包括:
预测分析的应用
在线营销是预测分析对商业产生重大影响的领域之一。零售商、营销服务提供商和其他组织使用预测分析工具来识别网站访问者浏览历史的趋势,从而个性化广告。零售商也使用客户分析为了推动更多关于零售商应该股票的产品类型的明智决策。
对于制造商来说,预测性维护也是一种有价值的应用,它可以监测设备是否有可能发生故障的迹象。作为物联网(IOT.)开发,制造商正在附加传感器对工厂车间的机械和机电产品,如汽车。来自传感器的数据用于预测何时应该进行维护和维修工作,以防止出现问题。
物联网还可用于监测油气管道、钻井平台、风车农场和各种其他领域的类似预测分析工业机构安装。为农民提供局部天气预报是物联网驱动的另一种预测模型应用,它部分基于安装在农田中的装有传感器的气象数据站收集的数据。
分析工具
在预测建模和分析中使用了各种工具。IBM,Microsoft,SAS研究所和许多其他软件供应商提供预测分析工具和相关技术支持机器学习和深度学习应用程序。
此外,开源软件在预测分析市场中起着重要作用。开源R语言分析通常用于预测性分析应用,就像Python和Scala.编程语言。还有一些开源预测分析和机器学习平台,包括Spark处理引擎中内置的算法库。
分析团队可以使用基本的R开源版本和其他分析语言,或者付费购买微软等供应商提供的商业版本。商业工具可能很昂贵,但它们提供了供应商的技术支持,而纯开源版本的用户必须自己排除故障,或者通过开源社区支持站点寻求帮助。