开始 让你自己跟上我们的介绍内容。

顶级数据可视化技术以及如何最好地使用它们

BI和分析团队以及自助BI用户可以从各种类型的数据可视化中进行选择。下面是12个例子,并给出了如何使用的建议。

可以使用各种各样的数据可视化技术来帮助业务用户找到BI和分析数据中的含义。可视化是商业智能流程的核心组件,由于数据基础设施的改进、BI工具的广泛使用以及数据素养的相应提高,许多企业对可视化的需求出现了爆炸式增长。

背后的核心想法数据可视化已经存在了几十年,但是多年来的可视化选项和实践已经发生了变化 - 而不是总是越来越好。由于BI开发人员和可视化设计师在显示数据时越来越花哨,图形变得密集,并且通常是缺席的。

“最后,我们正在达到一个客户需求推动设计的地方,并清楚地返回,”CloudCheckr,云管理平台供应商CloudCheckr高级UX Designer Gary Davis说。最终,戴维斯补充道,设计师仍在试图解决同样的问题:找到传达数据分析结果的最佳方式,以回答业务问题。

而不是使用标准数据可视化,BI分析人士数据科学家越来越多地创造了“可以帮助讲述故事”以直观的方式讲述的“,”CTO在咨询公司Lateveview Analytics中说。但他们和自助式双用户他注意到,需要谨慎地踩踏今天的数据可视化工具中内置的尖端技术和互动功能。“在频率和影响方面,可视化中的错误远远超过数据分析的其他方面的错误。”

Davis、Hariharan和其他BI和分析从业人员权衡了使用常用数据可视化技术的一些最好和最坏的方法,从线形图和柱状图到更详细的方法可视化数据。以下是其中12种技术,其中一个示例。

线条图表

线条图表对大多数人熟悉,并且可以一目了然地轻松分析精心分析的。“在监测数值属性随着时间的推移时,没有什么比在一个好的旧线条剧情更好,”开源分析软件供应商的数据科学家Paolo Tamagnini说KNIME AG)

线条图可以在单独的彩色曲线上显示不同的分类属性测量,因此用户可以快速比较它们。此外,制作线路绘图交互式可以帮助用户浏览大量可能在静态可视化中令人困惑的曲线。

在此期间2019冠状病毒病大流行例如,线条图表已经是最多使用的数据可视化技术,以说明疾病的传播并比较遏制措施国家通过国家的有效性,如下面所示的Tamagnini提供的互动示例。

折线图图像样本
按国家分列的COVID-19病例数据互动折线图

条形图

条形图是最简单,最知名的数据可视化技术之一。“人类的眼睛非常擅长比较分类的条形的长度 - 而不是角度,而不是颜色梯度,而不是弯曲的形状,”Tamagnini说。“这就是为什么我仍然喜欢在我可以的时候使用条形图。”

帕特里克米勒在咨询公司West Monroe Partners领导数据报告和可视化团队,这些条形图可以通过几乎任何没有培训或解释的人都可以理解。但留意让他们太忙的诱惑,他警告说。

条形图样本图像
比较公司年月收入的条形图

饼状图

饼状图是另一种著名的数据可视化类型,将整体的不同百分比表示为饼图的各个部分。它们非常养眼,但可视化专家说,它们不能像其他技术那样传达数据之间的差异。因此,他们可能很难解释。

“饼图以精确度排名低,因为用户发现难以准确比较馅饼片的尺寸,尽管当您提供高级消息时,这些图表可能会有所帮助,”数据和分析总监Manjula Mahajan说存储供应商NetApp。

示例饼图图像
显示调查数据的饼图

泡沫图表

气泡图用于基于每个气泡的X-Y位置和尺寸表达三维数据维度。由于解释性最小,泡沫图可以提供关于相对复杂的数据集的有用信息,Chris Adams表示,SparkPost的制造商的产品管理副总裁Chris Adam表示预测分析分析电子邮件外展努力的平台。

但是,亚当斯推荐,各种气泡的标签清晰可见。此外,他说气泡应该大小,所以它们不会碰到彼此,并且足够不同,以便快速传达关于所代表的数据的见解。例如,在下面所示的火花柱可视化中,气泡大小表示组织电子邮件广告系列的主题行中使用不同情绪的相对频率。

但并不是所有人都喜欢泡沫图表。马哈詹说他们并不总是很适合BI仪表板并且可能需要太多的心理努力来理解“由于他们缺乏精确度和清晰度”。

样本泡沫图象
泡沫图表显示公司电子邮件营销活动的数据

直方图

Sparkpost的数据科学副总裁Daniel Chalef表示柱状图提供有效的方法来可视化数据集中值的分布,这可以帮助用户在分析数据时。Chalef说,平均通常滥用并且可能是误导性的。例如,销售管道的平均交易规模可以偏离几个大型交易。为了提供更准确的信息,分析师可以使用直方图来显示不同价格范围内的交易数量,如下例所示。

直方图看起来像条形图,但它们专门用于说明数据分布。同样大小的数值范围称为已分组的数据值被调用垃圾箱如果没有数据属于这些范围,其中一些可能没有条款。直方图的一个潜在问题是确保箱体正确尺寸以传达有用和相关信息。

样本图像直方图
直方图显示有关销售管道交易大小的数据

暖步

一个的热图使用颜色编码来显示二维数据元素的大小。CloudCheckr的Davis说,这可以帮助他公司的客户了解他们的云基础设施的时间特征。例如,CloudCheckr使用热图来可视化不同时间段内云资源的使用情况,这样客户就可以看到关闭服务器或缩小服务器规模以降低成本的好时机。

但Joshua Moore是NetApp的云分析的主要技术专家表示,Heatmap是他最不喜欢的可视化技术,至少在他所看到的大多数情况下。他经常看到了几十个或数百个关键的绩效指标(KPIS.)在一个视图中在网格上追踪的服务器的操作健康状况,所有这些都显示为绿色。

“这只会造成混乱和噪音,”摩尔说。“健康的kpi既不需要行动,也不需要关注,那么为什么有人需要看到它们呢?”这样的条件格式最好保留在少数顶级kpi中,而不是巨大的热点图。”

样本Heatmap图像
Heatmap显示组织使用云资源的数据

散点图

散点图可用于显示数据的两个维度的相对密度。精心设计的,以易于阅读的方式量化和关联复杂的数据集。“经常,这些图表用于发现趋势和数据,尽可能多地显示数据,”Adams说。

例如,下面的SparkPost散点图使数字营销人员能够将电子邮件主题行中的字符数与电子邮件阅读速率相关联,以帮助他们识别最佳实践和计划未来的广告系列。

Knime的Tamagnini喜欢使用散点图来显示单个数据点的关系 - 对于此类用途,他说,它们更容易阅读和解释条形图和其他可视化技术。然而,他补充说,当分析师尝试显示超过两个维度时,散点图斗争奋斗。此外,将太多数据点包装到散点图中可以使其难以破译。

样本散射绘图图像
散点图显示电子邮件营销活动的数据

t-SNE

这种技术,正式称为T分布式随机邻居嵌入(T-SNE),使用a机器学习算法以模拟高维数据集作为两个或三维数据点,用于在散点图中显示,使用颜色,形状或其他可视元素来表示第三维度。它开发了解决传统散点图的一些局限性。

数据科学家挖掘T-SNE以转换原始数据中的关系,因此它们更容易可视化。“像T-SNE这样的数据转换技术采用是数据可视化领域数据素养和数据科学专业知识的直接后果,”Tamagnini说。

样本T-SNE图像
t-SNE散点图显示了来自PubMed的生物医学文献数据

桑基图

SANKey图表代表数据和过程通过线条和箭头流动,具有不同宽度的宽度,说明各个流量的大小。SparkPost的Chalef表示他们是一个“用于说明网络中流动的漂亮工具”,使用左向右运行的指示图。

西门罗的米勒说,桑基图一开始可能会让人眼花缭乱。但他补充说,这是一种灵活的可视化技术,即使在基础数据集存在巨大波动的情况下也能工作。例如,他使用它来可视化应用程序如何在一个复杂的、非刚性的工作流中移动。

“Sankey图并不容易理解,并且需要对用户解释以获得洞察力,”米勒说。他建议设计人员包括在可视化或仪表板中的指令或帮助文本,理想地在悬停信息字段中嵌入。

样本SANKEY图图像
桑基图显示美国能源消耗的估计数据

Triemaps.

一个treemap使用嵌套块显示分层数据,嵌套块根据它们所表示的数据值大小不同,可以装入其他块以显示大型数据集。例如,IT管理员经常使用树映射来跟踪系统中磁盘空间、内存或CPU资源的使用情况。这些块可以帮助用户确定数据趋势,尽管其大小的波动和如何排序是可视化设计师需要考虑的潜在复杂问题。

戴维斯说,CloudCheckr开始尝试基于个人安全问题的严重性和范围来试验Triemaps来可视化云安全漏洞。他说,很难将特定漏洞的大小和规模传递给客户使用其他数据可视化技术,并在帮助用户了解手头的问题和它所需的紧迫性水平方面表达了承诺。

Sample Treemap Image.
Treemap表示数据作为不同大小的块

圆的包装图

圆包装图是使用圆圈而不是块来表示数据对象之间的关系的Treemp填充图。康普康斯特·克鲁什系列网络产品的软件工程高级总监何婷表示,他发现它们有用用于显示网络的概述,并说明网络不同部分中的性能问题的严重性。

Ting表示,在较大的圆圈内绘制不同尺寸的圆圈使得网络数据三层,包括整体网络,各个控制器内的各个控制器内的不同区域。他补充说,这为网络的快速扫描提供了一个直升机的快速扫描,以及对问题的更深层次的能力。

样本圈包装图图像
圆包装图表显示网络问题数据

网络图

网络图通过显示节点和节点之间的连接线来表示数据元素的连接方式。LatentView的Hariharan说:“网络图表帮助可视化数据,而这些数据在不可视化的情况下很难掌握。”有很多例子:朋友网络及其关系的强度,系统和设备之间的数据传输,金融网络,疾病传播,交通和人员流动,犯罪活动等等。

设计网络图的挑战之一是决定展示什么和隐藏什么。“很多次,默认网络图就像一个没有明显的模式的泥球一样,”Hariharan说。设计师需要包含一个机制来显示大图片,然后逐步钻取,并在图表中缩放更多详细信息,他建议。

示例网络图图像
网络图显示公司,人和城市之间的联系

结合可视化

“简单的图表是强大的,但将它们组合在一起更强大,”Tamagnini说。例如,他组合一个条形图,散点图和并行坐标绘图在单个仪表板中,如下所示,为分析应用程序的底层数据提供更详细和交互式的视图以预测客户流失

三个可视化的组合使用户能够通过单击条形图中的关联列来选择搅拌或未搅扰的所有客户。所选客户组的数据自动显示在两个地块中,以便用户可以比较数字属性,看看是否存在它们和客户流失之间的相关性。这是Visual Analytics Mantra如何的例子创造1996年的UX和Visualization Pioneer Ben Shneiderman可以应用于各种数据可视化技术:“概述首先,缩放和过滤,然后按需详细说明。”

样本图像与组合数据可视化技术
显示客户流失数据的组合数据可视化

下一步

良好的BI仪表板设计的最佳实践

为2021年做好准备的8个商业智能趋势

商业智能书籍今年阅读

深入了解数据可视化软件

搜索数据管理
搜索AWS.
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭