Grafvision——Fotolia
自然语言查询工具提供的答案是有限的
自然语言查询工具可以有一天允许最终用户在没有数据科学家的帮助下进行所有数据分析,但此时该功能仍然有限。
自然语言查询有可能将分析放在普通商业用户手中,没有在数据科学中培训,但该技术仍然有一种方法可以进入真正的变革工具。
自然语言查询(NLQ)是容量询问通过简单地询问以普通语言而不是代码,可以进行语音或键入的数据。理想情况下,自然语言查询将授权企业用户进行深度分析,而无需代码。
然而,理想的是,不存在。
其目前的形式,自然语言查询允许有人在福特经销商处询问,“2019年出售有多少蓝色野马?”跟进,“2019年出售了多少个红色野马?”比较这两者。
它允许在服装店中的某人询问,“11月的冬季外套的销售预测是什么?”
然而,它不是足够的先进来拉非结构化数据存放在仓库中,它不够先进,无法执行复杂的查询和分析。
“我们已经有声音搜索,尽管现在的米尔福德,米尔福德,米尔福德,米尔福德的IT分析和研究公司Mike Leone表示,迈克利昂迈克利昂迈克利昂迈克利昂表示。”我们只是打自然语言处理可以有效地用于查询数据,但我们甚至不接近利用自然语言查询,以便复杂查询传统上需要广泛的后端工作和数据科学团队参与。“
同样地,数据库和分析咨询公司DbInsight的Tony Baer,创始人和首席执行官表示,自然语言查询是没如果没有数据科学家的参与,它允许深入分析。
“你不能进入特定的工具或数据库并询问任何随机的问题,”他说。“它仍然必须与某些结构相关联。我们不是在与人类交谈之类的地方,大脑可以处理它。在那里,我们是给定的守卫,给予数据和语法的一些结构,它是以特定方式构建查询的替代方案。“
NLQ好处
在最基本的水平,商业智能改善了决策过程。并且一个组织内的人员可以做数据驱动的分析,更明智的决策过程,而不仅仅是在组织的顶部,而是在整个员工中。
迈克利昂企业战略集团高级分析师
同时,自然语言查询不需要重大专业知识。它不会强制用户编写大量的代码来提出答案,以答案可能是一个相对简单的分析问题。它可以释放商务用户必须要求提供数据科学团队的帮助 - 至少对于基本查询。它打开了分析组织内的更多用户。
“良好的NLQ将帮助Bi Power用户和未经培训的企业用户更快地洞察力,但它是Constellation Research的首席分析师Doug Henschen表示,这是需要最多的企业用户,并拥有最大的收益。“这些用户不知道如何代码SQL,许多甚至甚至不熟悉查询构造,例如”向ME X“和”按Y时间段“,并且何时询问饼图与条形图与行图表。”
佛罗里达州坦帕市IT咨询公司Impact Analytix的创始人兼首席顾问珍?安德伍德(Jen Underwood)表示赞同:“想想那些想要撰写报告却做不到的人吧。”“探索中有一些真正的美。有多少人因为不会SQL而能够使用它?这很简单,它能激发你做更多事情的能力。”
实质上,自然语言查询和其他低码/缺口工具有助于提高数据素养,提高数据读写是许多组织的重要推动力。
尽管如此,以目前的形式来看,它还是有局限性的。
“向业务扩展了这种类型的功能将使人口的人口统计以舒适的方式与数据相互作用,”Leone说。“但不要指望数据革命只是因为有人可以使用alexa来看看有多少人在星期二买了袜子。”
限制
也许是全成熟的自然语言查询的最大障碍是语言本身的本质。
甚至没有进入全球超过5,000种语言,估计200到400个字母表,个别语言都很复杂。有一些单词拼写相同但具有不同的含义,其他符号拼写,但声音相同,而且与彼此没有视觉或听觉关系的单词,而是同义词。
在商业世界中,通常有可能意味着一个组织的一件事,并被另一个组织使用不同的方式。
自然语言查询工具不能真正理解口语或书面语。他们了解特定代码,并被编程为将口头或书面查询转换为SQL,然后将SQL的响应转换为口语或写入单词。
“自然语言查询在同义词和特定领域的术语方面有困难——上下文缺失,”Underwood说。“你仍然需要人来提供同义词和公司可能拥有的术语,因为不同的公司对不同的单词有不同的含义。”
当口语自然语言查询时,口音会导致问题。无论是口语还是写的,丝毫工具误解可以导致无用的响应,或者更糟糕的是,事情不正确。
“谈到查询时的准确性是国王,”ESG的Leone说。“所有所需要的只是对语音请求产生不正确结果的轻微误解。”
在未来几年内,他说,人们会依靠自然语言查询来快速向他们的设备提出基本问题,但不多。
“不要指望NLQ会取代数据科学团队,”Leone说。“NLQ将作为一种快速返回结果的方式,然后作为更复杂的查询和专家分析的跳板。”
虽然现在受到语言的限制,但情况并不总是如此。工具将变得更加复杂,并得到机器学习那将来理解用户的模式,以更好地理解他们所要求的。
“大多数在途中站立的大部分是缺乏经验,”Dbinsight的Baer说。“这还在早期。今天的自然语言查询远远从两年前的地方高涨,但仍然有很大的改善。我认为改善将是增量的;机器学习将有所帮助。”
顶级NLQ工具
虽然功能有限,但在询问结构化数据的基本问题时,自然语言查询工具确实为业务用户节省了大量时间。一些厂商的自然语言查询工具比其他厂商更好。
尽管甲骨文是2007年收购Hyperion之后的顶级BI供应商之一,但当数据可视化改变了分析的消费方式后,甲骨文失去了发展势头。现在,增强智慧而且机器学习是BI的中央原则,然而,Oracle再次推动BI平台的技术能力。Oracle Analytics云日复一日地支持基于语音的查询及其自然语言查询以28种语言,亨氏说是最广泛的语言支持。
“Oracle在几年前向自然语言查询筹集了一系列,当时它在日常应用程序发布时,它使用了使用设备原住语语音文字并引入了明确的竖起大拇指/竖起大拇指训练,”亨文说。
另一个供应商亨氏指出是QLIK,它通过2019年1月推出了其平台的自然语言能力收购Crunch Data。
Henschen说:“CrunchBot是一项关键资产,后来更名为Qlik Insight Bot。”
他补充说,Qlik Insight Bot是一个配备的Bot建筑功能,适用于现有的QLIK应用程序,随后可以嵌入在第三方应用程序中,包括Salesforce,Slack,Skype和Microsoft团队。
“它在Qlik感觉和与BI系统的互动之外带来了NLQ,”亨文说。
Tableau是另一家试图通过自然语言处理工具简化分析过程的供应商。他们2019年2月推出Ask Data和表2019年9月更新包括在其他应用程序中嵌入Ask Data的功能。
“当我考虑设计一个系统并将其进一步发展时,Tableau正在做一些事情。(它能记住是否有人提出了类似的问题)并提供指导,”安德伍德说。“它有信息,知道人们在问什么,它可以提出建议。”
Baer类似地提到了Tableau的询问数据,而Leone则表示,自然语言查询的最终普遍性最终将由亚马逊Web服务,谷歌和微软驱动。