BI和Analytics的Dataops框架的关键要素
DataOps为BI过程带来速度和敏捷性,并有助于将数据管理与业务目标保持一致。了解Dataops框架的关键元素。
dataops - 有时被描述为“devops for data.——对许多公司来说仍然是一个新概念。与德沃斯,Dataops框架的主要目标是更有效地为业务生成更多价值,在这种情况下通过加速BI和高级分析过程。
该方法包含敏捷软件开发原理和使用自动化测试,集装箱化,编排和监控,以加快BI和分析应用的数据管道的生产。像敏捷一样,DataOps也经常需要重大组织和文化变革,包括在IT运营和软件开发团队中打破孤岛,并鼓励业务范围利益相关者与数据工程师,数据科学家和数据库双分析师。成功的Dataops框架不仅速度向业务提供数据洞察力,还可以提高数据质量。
“良好的DataOps功能启用数据科学家英国切斯特Chetwood Financial Limited的DevOps和DataOps主管Stephen Lynch解释说:“我们希望分析师和BI开发者能够处理格式良好、结构良好的数据集,而不必担心数据如何到达这些数据集的技术复杂性。
尽管如此,随着IT和商业智能运营争取Dataops为他们的双倡议,他们可能会觉得这项新学科的最佳实践与传统相反数据管理技术他们长期练习。毕竟,Dataops的一个原则是,BI团队和其他数据分析师应该花更多的时间分析数据,更少的时间担心它来自哪里以及它如何到达它们,而且它将如何担心它们。
但是,DataOps方法在Gartner的研究副总裁和分析师,没有折扣数据质量的价值,强调尼克·赫德克尔。它假设组织已经达到了强大的数据治理规则和声音文档程序。通过治理规则和文件占,实施了许多利益DataOps方法帮助加速BI和分析应用程序,他说。其中最主要的是跟上商业环境需求的能力数据增加——对商业成功也越来越重要。
Heudecker说:“随着数据和分析团队在支持更多样化、更复杂、更关键的业务流程方面变得越来越重要,许多人面临着扩展他们在提供数据以支持一系列消费者和用例方面的工作的挑战。”面对不断变化,需要更快地提供高质量数据洞察的持续压力要求数据和分析领导者重新思考他们的团队是如何组织和如何工作的。
“以传统的瀑布为导向的方法没有满足需求 - 需求定义与价值的交付之间的距离太大,所需的时间太长,而且太多的关键任务丢失或跨越角色和团队孤岛丢失,”他解释。“Dataops技术可以通过更敏捷,协作和改变友好的方法来构建和管理数据交付管道来解决这些挑战。”
Dataops框架:五个主要元素
Dataops框架有五个主要要素,Daniel Skidmore,Dataops高级总监Daniel Skidmore,在犹他州盐湖城的盖茨州。
- 沟通。“Dataops在开发过程中提前通信中的本地团队,开发和运营,从而避免了数据筒仓的创建,”Skidmore说。
- 管道集成。BI计划中有两种类型的数据系统或管道:系统的记录以及创新体系。“记录/价值系统是具有详细和既定规则的既定系统。他们通常较慢地接受改变,”Skidmore说。
创新系统往往涉及企业需要一些快比记录系统可以提供的。因此,他们设置了自己的数据系统,这些数据系统更为灵活和自助服务。目标是让综合记录和创新系统,但这可能是挑战性的,Skidmore指出。
“通过引入敏捷方法,Dataops试图帮助整合两条管道。这有助于防止筒仓,”他说。
- 部署在Docker容器中的物理数据模型。“这将整体融入数据模型容器中,并在一致的测试数据创建或一代中辅助,”滑雪道说。
- 敏捷开发的心态。Skidmore表示,数据团队需要从传统的瀑布项目方法迁移到一个敏捷一个,可以帮助鼓励创新和速度部署时间。
- 更短的反馈循环。这是一个很大的挑战,滑雪道强调。“缩小不同团队之间的通信时间对于DataOPS成功和采用敏捷开发至关重要。大部分典型的延迟不是处理相关的,但由于等待不同的个人和团队的反馈,”他说。
Dataops挑战以及如何解决它们
在实现Dataops框架时,组织必须了解DataOps及其挑战Heudecker说,每个IT商业智能组织都会有所不同。
Heudecker说:“重要的是要确定数据传输的瓶颈在哪里,并依次解决每个瓶颈。”他补充说,问题可能不是技术。“你不能买数据ops。在大多数情况下,不同的数据生产者和消费者只需要在统一的指标和共享的业务目标和结果的指导下更好地相互访问。”
Heudecker说,为了取得成功,组织应该从自上而下的“命令和控制”治理方法演变为一种更加环境敏感、鼓励创新、与价值挂钩并支持分布式用户组的治理方法。
Heudecker说,数据团队还应该更加访问新的数据用户范围更能访问。“这可能意味着引入新兴角色,如数据产品经理,协作和协调数据生产者和消费者。它也可能意味着嵌入以数据为中心的角色,如数据工程师在业务部门内部。”
在度量标准方面,“我们仍在研究与数据交付样式的有意义的指标,因为数据传递样式进化,”Heudecker指出。一些早期的想法包括两类指标:与生产相关的(例如交付及时性,平均恢复时间,数据质量等)和客户相关的(例如数据共享能力)。
至于技术,Heudecker建议“监控数据流水线和数据交付的自动化。”基本上,这带来了熟悉的要素Devops Toolkit.围绕应用程序开发周期中常见的持续部署和集成。
作为缔约立建议,Skidmore指出,获得技术权是最容易的。
“改变文化接受敏捷原则并让每个人都在同一页面上是最艰难的挑战,”滑雪道说。“如果你可以让所有参与的团队能够购买计划,那么成功将更加容易实现。”