电子帐册:

预测性数据分析使企业在游戏中领先

Guido vrola - Fotolia

管理 学习应用最佳实践并优化您的操作。

不要让数据驱动的方法来自分析方程的AX判断

数据分析可以帮助改善组织的决策。但是人类的直觉和判断需要成为这幅图景的一部分,以防止预测模型和分析算法出错。

在2012年总统选举之前,数据科学大师Nate Silver着名使用分析模型来正确预测所有50个州的获胜者。去年11月,他的模特不是如此:在选举日的早晨,它给了希拉里克林顿赢得了71.4%的机会赢得总统的机会 - 这是它在前48小时内增加了六个百分点的概率。事实证明,该模型在向唐纳德特朗普转向唐纳德特朗普的五个战场状态中的每个战地状态都做错了。

但是银差不多,有点,有点预测发生了什么:克林顿的流行投票胜利和选举大学损失。在几个关于该模型预测的博客帖子中,包括在选举日提前发表的决赛,他概述了这种情况作为一种独特的可能性,指出了导致克林顿薄铅的潜力的因素,如关键状态。尽管如此,分析网站Fivethirtyight的创始人和编辑陷入了他的数据驱动方法并写道,克林顿可能会赢得胜利,她可以赢得大幅度。“

这并不是对Nate Silver和他的分析方法的批判。是的,他确实搞错了,就像所有试图预测选举的人一样。但他是最接近成功的数据科学家根据高级分析算法告诉他们的信息做出预测。显然,他在数据中看到了一些东西,让他改变了主意。这似乎是在一个情况下,人类的直觉几乎胜过(抱歉)最终错误的输出分析模型。对于企业界的分析经理和数据科学家来说,我们可以从中吸取教训。

分析数据的缺点

数据是一件好事,但它并不是无可救药的。数据集,尤其是从不同源系统中拉在一起的数据集,必然包含不一致和错误如果未预先确定和固定,则可以发送分析努力AWRY。“嘈杂”数据隐藏了杂散的​​有效信息,这些信息可以歪斜令人讨厌的方式歪斜分析结果。相关数据首先,永远不会发现其进入预测模型的方法,使数据分析师与不完整的信息一起使用。

随着更多组织部署大数据系统和更多组织,此问题正在成为分析团队的更大一个。预测分析工具,包括机器学习和人工智能软件。在由SearchBusinessAnalytics Publisher Techyabo2008target进行的正在进行的调查中,预测分析在商业智能(BI)和分析技术中排名第一为计划购买。截至1月中旬,占7,000多个,分析和商业专业人员的39.6%表示,他们的组织希望在未来12个月内投资预测分析。

不要误解我的意思:数据驱动的方法可能会有所帮助改善决策在公司和武装业务主管,营销经理和其他终端用户的信息,他们可以使用提升商业绩效。我曾与IT、BI和分析经理交谈过,他们仍在努力让组织中的高管使用这些工具数据分析工具。基于积累的知识、以前的经验和直觉来管理业务运营也不是绝对正确的。

参与分析应用程序

然而,无论是数据分析师还是他们所服务的业务用户,人类的判断都不应该被完全抛到一边。从这个开始数据准备过程- 数据科学家和数据工程师必须确保他们使用正确的数据,并且它是正确的结构和为预期的分析应用程序组织。它仍然随着预测模型建造然后进行测试 - 或“培训” - 试图确保他们会产生有效的结果。它肯定适用于数据科学家审查这些结果并评估其准确性,并且随着调查结果与最终用户共享。

汽车保险公司Progressive是一个严重依赖的公司数据驱动方法在其业务决策过程中。“我们希望人们能够有直觉和想法,但他们需要向他们提供数据,”Pawan Divakarla,Progressive的数据和分析商业领袖表示。

但与此同时,该公司的数据科学家花了大量时间清理用于分析的数据,然后评估算法的准确性,以及如何改进它们。迪瓦卡拉说,重要的是,算法生成的信息可以安全地用来证明所有这些直觉和想法。

数据和人为因素的混合是分析成功的最佳配方。在2015年会议主旨演讲中谈到管理数据驱动应用程序, Nate Silver自己建议让数据指导分析过程的前80%,然后把控制权交给数据分析师和业务用户,这样他们就可以对分析进行现实检查。

数据可以告诉你很多事情可能的冠军总统选举。但如果它说的对你来说并不完全正确,听听你脑海中响起的警钟是个好主意。

下一个步骤

经验丰富的IT和分析专业人士分享提示创建数据驱动组织

基于Hadoop的大数据系统推广更广泛采用数据驱动的分析

如何在数据驱动和数据痴迷之间把握好界限

深入了解预测分析

搜索数据管理
搜索AWS
搜索内容管理
搜索甲骨文
搜索SAP
搜索SQL服务器
关闭