开始 通过我们的介绍内容让您自己加快速度。

顶级数据可视化技术以及如何最好地使用它们

BI和Analytics团队和自助式BI用户可以选择各种类型的数据可视化。以下是12的示例,有关何时使用它们的建议。

各种数据可视化技术可用于帮助业务用户在BI和Analytics数据中找到含义。可视化是商业智能流程的核心组成部分,许多企业都在通过数据基础设施的改进,更广泛地使用BI工具以及数据素养的相应增加,我们需要爆炸。

背后的核心想法数据可视化已经存在了几十年,但是多年来的可视化选项和实践已经发生了变化 - 而不是总是越来越好。由于BI开发人员和可视化设计师在显示数据时越来越花哨,图形变得密集,并且通常是缺席的。

云管理平台供应商CloudCheckr的高级用户体验设计师加里•戴维斯(Gary Davis)表示:“最终,我们到达了一个由客户需求驱动设计的阶段,清晰度正在回归。”最终,Davis补充道,设计师们仍然在试图解决同样的问题:找到沟通数据分析结果来回答商业问题的最佳方式。

而不是使用标准数据可视化,双分析师数据科学家越来越多地创造了“可以帮助讲述故事”以直观的方式讲述的“,”CTO在咨询公司Lateveview Analytics中说。但他们和自助式BI用户他警告说,在使用当今数据可视化工具中内置的尖端技术和交互功能时,需要谨慎行事。“在可视化方面的错误远远超过了数据分析的其他方面的错误,无论是在频率和影响方面。”

戴维斯,Hariharan等BI和分析从业者在一些最佳和最糟糕的方法中称重,从线和条形图到更精细的方法可视化数据。下面是其中的12种技术,并分别给出了示例。

线条图表

折线图对大多数人来说都很熟悉,而且设计良好的折线图可以很容易地进行分析。开源分析软件供应商的数据科学家Paolo Tamagnini表示:“当监测一段时间内的数值属性时,没有什么比一个好的旧线形图更好的了。KNIME AG

线条图可以在单独的彩色曲线上显示不同的分类属性测量,因此用户可以快速比较它们。此外,制作线路绘图交互式可以帮助用户浏览大量可能在静态可视化中令人困惑的曲线。

在此期间2019冠状病毒病大流行例如,折线图一直是最常用的数据可视化技术,用于说明疾病的传播和比较各国遏制措施的有效性,如下图所示Tamagnini提供的交互式示例所示。

样品线图图像
交互式线图显示Covid-19案例数据按国家/地区

条形图

条形图是最简单,最知名的数据可视化技术之一。“人类的眼睛非常擅长比较分类的条形的长度 - 而不是角度,而不是颜色梯度,而不是弯曲的形状,”Tamagnini说。“这就是为什么我仍然喜欢在我可以的时候使用条形图。”

西门罗合伙人咨询公司(West Monroe Partners)的数据报告和可视化团队负责人帕特里克·米勒(Patrick Miller)说,几乎任何人都可以不经过培训或解释就理解柱状图。但要小心让他们太忙的诱惑,他警告说。

样本条图图像
条形图比较公司的收入逐年和月份

饼状图

饼形图是另一种众所周知的数据可视化类型,其中整体的不同百分比表示为饼的切片。他们制作了伟大的眼睛糖果,但可视化专家表示,他们不会传达数据之间的差异以及其他技术。结果,它们可能很难解释。

“饼图以精确度排名低,因为用户发现难以准确比较馅饼片的尺寸,尽管当您提供高级消息时,这些图表可能会有所帮助,”数据和分析总监Manjula Mahajan说存储供应商NetApp。

样本饼图图像
显示调查数据的饼图

泡沫图表

气泡图用于基于每个气泡的X-Y位置和尺寸表达三维数据维度。由于解释性最小,泡沫图可以提供关于相对复杂的数据集的有用信息,Chris Adams表示,SparkPost的制造商的产品管理副总裁Chris Adam表示预测分析分析电子邮件外展努力的平台。

然而,亚当斯建议,各种气泡的标签应该清晰可见。此外,他还表示,气泡的大小应该适中,这样它们就不会相互碰撞,而且足够不同,可以快速传达它们所代表的数据的见解。例如,在如下所示的SparkPost可视化中,气泡的大小表明了不同情绪在一个组织的电子邮件活动的主题栏中使用的相对频率。

但不是每个人都是泡沫图表的粉丝。马哈哈说他们并不总是一个适合BI仪表板并且可能需要太多的心理努力来理解“由于他们缺乏精确度和清晰度”。

样本泡沫图象
泡沫图表显示公司电子邮件营销活动的数据

直方图

Sparkpost的数据科学副总裁Daniel Chalef表示直方图提供一种有效的方法来可视化数据集中的值的分布,这可以帮助用户分析数据。查勒夫说,平均值经常被误用,可能具有误导性。例如,销售渠道中的平均交易规模可能会受到几笔大型交易的影响。为了提供更准确的信息,分析师可以使用直方图来显示不同价格范围内的交易数量,如下面的例子所示。

直方图看起来像条形图,但它们专门用于说明数据分布。同样大小的数值范围称为已分组的数据值被调用垃圾箱如果没有数据属于这些范围,其中一些可能没有条款。直方图的一个潜在问题是确保箱体正确尺寸以传达有用和相关信息。

样本直方图图像
显示销售渠道交易规模的柱状图

暖步

一种热线图使用颜色编码来显示两个维度中的数据元素的大小。CloudCheckr的戴维斯表示,可以帮助他的公司客户了解云基础架构的时间特征。例如,CloudCheckr使用HeatMaps在不同的时间段中可视化云资源的使用,因此客户可以看到不断关闭或缩小服务器以降低成本的好时机。

但Joshua Moore是NetApp的云分析的主要技术专家表示,Heatmap是他最不喜欢的可视化技术,至少在他所看到的大多数情况下。他经常看到了几十个或数百个关键的绩效指标(kpi)在一个视图中在网格上追踪的服务器的操作健康状况,所有这些都显示为绿色。

“这只是创造了杂乱和噪音,”摩尔说。“健康的KPI既不需要动作也不关注,为什么有人需要看到它们?像这样的条件格式最好是少量的顶级KPI,而不是巨大的热量。”

样本Heatmap图像
Heatmap显示组织使用云资源的数据

散点图

散点图用于显示二维数据的相对密度。设计良好的数据以易于阅读的方式量化和关联复杂的数据集。亚当斯说:“通常,这些图表被用来发现趋势和数据,就像它们被用来可视化数据一样。”

例如,下面的SparkPost散点图使数字营销人员能够将电子邮件主题行的字符数与电子邮件阅读率联系起来,以帮助他们确定最佳实践并计划未来的活动。

Knime的Tamagnini喜欢使用散点图来显示单个数据点的关系 - 对于此类用途,他说,它们更容易阅读和解释条形图和其他可视化技术。然而,他补充说,当分析师尝试显示超过两个维度时,散点图斗争奋斗。此外,将太多数据点包装到散点图中可以使其难以破译。

样本散射绘图图像
散点图显示电子邮件营销活动的数据

T-SNE.

这种技术,正式称为T分布式随机邻居嵌入(T-SNE),使用a机器学习算法以模拟高维数据集作为两个或三维数据点,用于在散点图中显示,使用颜色,形状或其他可视元素来表示第三维度。它开发了解决传统散点图的一些局限性。

数据科学家挖掘T-SNE以转换原始数据中的关系,因此它们更容易可视化。“像T-SNE这样的数据转换技术采用是数据可视化领域数据素养和数据科学专业知识的直接后果,”Tamagnini说。

样本T-SNE图像
一个T-SNE散点图,显示来自PUBMED的生物医学文献数据

Sankey图

SANKey图表代表数据和过程通过线条和箭头流动,具有不同宽度的宽度,说明各个流量的大小。SparkPost的Chalef表示他们是一个“用于说明网络中流动的漂亮工具”,使用左向右运行的指示图。

西蒙罗的米勒表示,首先可以在视觉上大幅压倒。但是,它是一种灵活的可视化技术,即使在底层数据集中的大规模波动也可以使用。例如,他使用它来可视化应用程序如何通过复杂的非身份工作流程。

“Sankey图并不容易理解,并且需要对用户解释以获得洞察力,”米勒说。他建议设计人员包括在可视化或仪表板中的指令或帮助文本,理想地在悬停信息字段中嵌入。

样本SANKEY图图像
显示关于美国能源消耗的估计数据的Sankey图

Triemaps.

一种treemp.使用嵌套块显示分层数据,这些块基于它们表示的数据值不同,并且可以将其包装到其他块以显示大数据集。例如,IT管理员经常使用Treemaps来跟踪系统中使用磁盘空间,内存或CPU资源的使用。该块可以帮助用户识别数据趋势,尽管它们尺寸的波动以及它们的排序方式是如何潜在的并发症,可视化设计人员需要考虑。

戴维斯说,CloudCheckr开始尝试基于个人安全问题的严重性和范围来试验Triemaps来可视化云安全漏洞。他说,很难将特定漏洞的大小和规模传递给客户使用其他数据可视化技术,并在帮助用户了解手头的问题和它所需的紧迫性水平方面表达了承诺。

样本treemap形象
Treemap表示数据作为不同大小的块

圈包装图表

圆包装图是使用圆圈而不是块来表示数据对象之间的关系的Treemp填充图。康普康斯特·克鲁什系列网络产品的软件工程高级总监何婷表示,他发现它们有用用于显示网络的概述,并说明网络不同部分中的性能问题的严重性。

Ting表示,在较大的圆圈内绘制不同尺寸的圆圈使得网络数据三层,包括整体网络,各个控制器内的各个控制器内的不同区域。他补充说,这为网络的快速扫描提供了一个直升机的快速扫描,以及对问题的更深层次的能力。

样品圆包装图表图像
圈包装图表显示网络问题的数据

网络图

网络图表示数据元素通过显示节点和它们之间的链路线连接的方式。“网络图有助于可视化最难掌握的数据而无需可视化,”Latentview的Hariharan说。有很多例子:朋友网络和他们的关系力量,系统和设备之间的数据传输,金融网络,疾病传播,运输和人民运动,犯罪活动等。

设计网络图的一个挑战是决定显示什么和隐藏什么。“很多时候,默认的网络图就像一个泥球,没有明显的模式,”Hariharan说。他建议,设计师需要包含一种机制来显示大局,然后随着用户在图上的放大,逐步深入并看到更多细节。

示例网络图图像
显示公司,人和城市之间的连接的网络图

组合可视化

“简单的图表很强大,但是将它们组合在一起就更强大了,”KNIME的Tamagnini说。例如,他在一个指示板中组合了条形图、散点图和平行坐标图,如下所示,以提供底层数据的更详细和交互式视图,供分析应用程序预测客户流失

三个可视化的组合使用户能够通过单击条形图中的关联列来选择搅拌或未搅扰的所有客户。所选客户组的数据自动显示在两个地块中,以便用户可以比较数字属性,看看是否存在它们和客户流失之间的相关性。这是Visual Analytics Mantra如何的例子创造1996年的UX和Visualization Pioneer Ben Shneiderman可以应用于各种数据可视化技术:“概述首先,缩放和过滤,然后按需详细说明。”

具有组合数据可视化技术的示例图像
组合数据可视化显示客户流失数据

下一个步骤

良好的BI仪表板设计的最佳实践

8商业智能趋势为2021年做准备

商业智能书籍今年阅读

深入挖掘数据可视化软件

搜索数据管理
搜索AWS.
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭