预测分析
预测分析是高级分析使用新的和历史数据来预测活动,行为和趋势。它涉及申请统计分析数据集的技术,分析查询和自动化机器学习算法创建预测模型那个地方值 - 或分数- 关于发生特定事件的可能性。
预测分析软件应用程序使用可以测量和分析的变量来预测个人、机器或其他实体的可能行为。预测分析可以用于用例的多样性。例如,在定价和发出汽车保险政策时,保险公司可能会考虑潜在的驾驶安全变量,例如年龄,性别,位置,车辆和驾驶记录类型。
将多个变量组合成具有可接受的可靠性水平评估未来概率的预测模型。该软件严重依赖于高级算法和方法,例如逻辑回归楷模,时间序列分析和决策树。
预测分析随着大数据系统。随着企业在Hadoop集群和其他大数据平台中大使大量更大的数据池,他们创造了增加的数据挖掘机会来获得预测的见解。IT供应商的机器学习工具的开发和商业化也有助于扩大预测分析功能。
营销,金融服务和保险公司已成为显著的用户预测分析,具有大型搜索引擎和在线服务提供商。预测性分析也常用于医疗保健,零售和制造等行业。
预测分析的商业应用程序包括定位在线广告、分析客户行为以确定购买模式、标记潜在的欺诈性金融交易、识别有发展特定医疗状况风险的病人,并在工业设备发生部件故障前检测出即将发生的故障。
预测分析过程和技术
预测分析需要具有统计方法和构建预测数据模型能力的高级专业知识。因此,它通常处于数据科学家,统计学家和其他熟练的数据分析师。他们支持数据工程师他们帮助收集相关数据并为分析做准备,软件开发人员和业务分析人员则提供帮助数据可视化那仪表板和报告。
数据科学家使用预测模型来寻找相关性在网站点击数据中的不同数据元素之间,患者健康记录和其他类型的数据集。发生数据收集后,根据需要,制定统计模型,培训和修改以产生准确的结果。然后将模型与所选数据运行以生成预测。在某些应用中分析完整数据集,但在其他应用程序中,分析团队使用数据采集简化流程。当其他信息可用时,将验证或修改数据建模。
预测分析过程并不总是线性的,相关性往往会出现在数据科学家没有注意到的地方。出于这个原因,一些企业正在招聘拥有物理和其他硬科学学科学术背景的人来填补数据科学家的职位。在遵循科学方法的前提下,这些工作人员很乐意按照数据指引的方向去做。即使企业遵循更传统的方式,聘用受过数学、统计学和计算机科学培训的数据科学家,但对数据探索持开放态度是有效预测分析的关键属性。
一旦预测性建模生产可操作的结果,分析团队就可以与商业管理人员分享,通常借助仪表板和报告提供信息,并根据调查结果突出未来的商机。功能模型也可以内置于操作应用程序和数据产品中,以提供实时分析功能,例如a推荐引擎在一个在线零售网站上,根据顾客的浏览活动和购买选择指向特定的产品。
除了数据建模,数据科学家和从事预测分析的专家使用的其他技术可能包括:
预测分析的应用
在线营销是预测分析具有重要业务影响的一个领域。零售商,营销服务提供商和其他组织使用预测分析工具来确定网站访问者浏览历史的趋势,以个性化广告。零售商也使用客户分析为了推动更多关于零售商应该股票的产品类型的明智决策。
对于制造商来说,预测性维护也是一种有价值的应用,它可以监测设备是否有可能发生故障的迹象。作为物联网(IOT.)开发,制造商正在附加传感器到工厂地板和机电产品,如汽车等机械。传感器的数据用于预测维护和维修工作以防止问题。
IOT还使类似的预测分析用于监测石油和天然气管道,钻井钻井平台,风车场和各种其他工业机构安装。部分基于农民的农民的局部天气预报是从安装在农场领域的传感器天气数据站收集的数据是另一个IOT驱动的预测建模应用程序。
分析工具
在预测建模和分析中使用了各种工具。IBM,Microsoft,SAS研究所和许多其他软件供应商提供预测分析工具和相关技术支持机器学习和深度学习应用程序。
此外,开源软件在预测分析市场中起着重要作用。开源R分析语言通常用于预测性分析应用,就像Python和Scala.编程语言。还有一些开源预测分析和机器学习平台,包括Spark处理引擎中内置的算法库。
分析团队可以使用基本的R开源版本和其他分析语言,或者付费购买微软等供应商提供的商业版本。商业工具可能很昂贵,但它们提供了供应商的技术支持,而纯开源版本的用户必须自己排除故障,或者通过开源社区支持站点寻求帮助。