Spark Analytics库在数据科学家中绘制
在这个播客中,找出为什么Apache Spark不仅仅适用于数据工程师。数据科学家正在寻找有助于分析活动的火花大数据框架。
Apache Spark经常被认为是作为一个工具数据工程师在后面的房间里。毕竟,它的甜蜜点通常被认为是处理数据,它与Hadoop密切相关,这可以使其对数据管理活动有吸引力。
但证据显示数据科学家越来越多地拥有自己的工作工具。一个新的调查从托管托管的Spark Vendor Databricks Inc.,该公司创始人包括开发原始开源的一些程序员Spark Analytics.引擎,显示该技术正在用于建立商业智能报告,推荐引擎和数据科学家的其他传统领域。
先进的分析功能,例如Spark的机器学习算法库,被引用为实现火花的最高原因。虽然以开发人员为中心的编程语言Scala看到了Spark用户的减少,但更通用的目的和分析人士友好的Python是Spark环境中使用的最快语言。
聆听这个播客,了解更多关于Spark Analytics计算框架如何在数据管理社区外获得有利的信息。我们也深入了解Python,以了解为什么它在数据科学家之间变得如此受欢迎。最近的一个Searyabo2008chBusinessAnalytics文章看了纽约时报是使用python.因为它往往与一般计算技能重叠。这一趋势意味着知道Python的分析师一旦完成了数据分析,就可以建立一个像App或Web门户等数据产品。Python可能不是特定于r编程语言的统计数据,但它确实在分析领域中提供了一些类似的功能。
Ed Burns是SearchBusinessAnalyabo2008ytics的网站编辑器。给他发电子邮件[电子邮件受保护]在推特上关注他:@edburstt.。