数据可视化

什么是数据可视化?

你需要知道的三件事

数据可视化是将数据转换为图形表示的过程,如绘图、图表、地图和3D可视化,帮助您轻松识别数据中的模式、趋势和异常值。

通过这些数据可视化,您可以看到仅通过查看原始数据很难或不可能观察到的关系,尤其是来自传感器、数据记录器、医疗记录、web搜索模式和购买模式等源的大数据集。数据可视化在将数据转换为可操作信息方面发挥着关键作用。

数据可视化如何帮助?

数据可视化技术因领域而异。

计算金融

使用历史或实时市场数据,数据可视化有助于快速识别模式和趋势,检测异常,并获得有意义的见解。数据可视化有助于执行分析、开发预测模型、评估风险和规范化交易策略。

下图模拟了根据历史数据拟合的时间序列模型得出的电力现货价格的未来行为。

电力现货价格图,显示历史现货价格和趋势以及模拟现货价格和走势。日期在x轴上,现货价格在y轴上。

电力现货价格图,显示具有预测确定性趋势的历史数据。

信号处理

信号处理用于语音分析、心率监测、无线通信、遥感、气候监测和GPS等应用。常见任务包括预处理和比较信号、设计数字滤波器、转换信号、执行测量以及检测模式和事件。数据可视化用于分析时域、频域和时频域中感兴趣的信号。

下图是一只太平洋蓝鲸的音频数据。可视化是在MATLAB中创建的®使用信号分析仪应用程序这有助于在时域和频域中可视化信号。

Signal Analyzer应用程序的屏幕截图,其中包含从太平洋蓝鲸音频中提取的信号数据和数据图。

从太平洋蓝鲸的声音中提取的感兴趣区域。

图像处理与计算机视觉

图像和视频处理有助于查找形状、计数对象、识别颜色、测量对象属性以及查找其他有意义的信息。图像处理技术通常作为预处理步骤应用于计算机视觉工作流中。该领域的应用包括智能手机的面部识别、自动驾驶车辆中的行人和车辆回避、视频监控、医学MRI中的肿瘤检测以及其他图像检索系统。

例如,宝马在辅助驾驶视图(ADV)中使用计算机视觉功能来描绘周围的车辆并识别其类型。

B M W辅助驾驶员视图的屏幕截图,演示对象检测。

宝马辅助驾驶员视图。MATLAB用于自动验证,包括图像注册、异议检测、地面真相标记,以及根据测试输出测试ADV场景。

人工智能(AI)

数据可视化在使用机器学习或深度学习开发人工智能模型中发挥着重要作用,因为模型依赖于难以解释的大数据集。在机器学习中,聚类分析有助于检测异常和监督学习中的数据预处理。主成分分析(PCA)t吨-分布式随机邻域嵌入(t-SNE)是两种最常用的数据可视化技术,因为它们有助于减少数据维度,因此您可以专注于关键的差异化维度。

在深度学习中,您可以使用数据可视化(如网络准确性和损失图)来监控训练进度,并使用可视化技术(如梯度加权类激活映射(Grad-CAM)、遮挡敏感性、局部可解释模型-认知解释(LIME)和深度梦)来调查训练的网络。

马哈拉诺比斯、科辛、切比雪夫和欧几里得三种不同种类的鸢尾。

使用Fisher虹膜数据集绘制不同种类的虹膜图。使用绘制的可视化效果坦桑尼亚先令功能。

数据可视化是如何工作的?

软件包提供了将原始数据转换为丰富可视化的功能,如绘图、图表和图表。以下是自行车交通密度数据的示例。仅通过目视检查原始数据,很难在数据点之间建立关系。

预览原始自行车交通密度数据。
时间戳 总计 西行 东行 时间
‘2015-06-24 07:00:00’ '星期三' 141 13 128 7
‘2015-06-24 08:00:00’ '星期三' 327 44 283 8
‘2015-06-24 09:00:00’ '星期三' 184 32 152 9
‘2015-06-24 10:00:00’ '星期三' 94 30 64 10
‘2015-06-24 11:00:00’ '星期三' 67 24 43 11
‘2015-06-24 12:00:00’ '星期三' 66 32 34 12
‘2015-06-24 13:00:00’ “星期三” 67 32 35 13

这个条形图下图显示,自行车交通密度在一周中的几天内不断上升和下降。现在很明显,与周末相比,平日骑自行车的人数更多。通过这种可视化,我们可以推断出,在这条路线上骑自行车的人主要是往返于工作场所。

一周中每天骑自行车的人数中位数条形图。

使用条形图绘制自行车交通数据。

散点图可用于从同一数据中获得更多见解。下图显示了一天中特定时间向东行驶和向西行驶的自行车总数。根据该地块,我们可以得出结论,东行路线通向商业区,西行路线通向住宅区。此外,我们可以确定,高峰时间交通量为东部路线上午8:00-10:00,西部路线下午4:00-6:00。

波士顿自行车交通散点图。一天中的时间在x轴上,自行车总数在y轴上。蓝色圆点表示东行骑手,血橙色圆点表示西行骑手。

按时间划分的东行和西行自行车交通。 

群图是一种特殊的散点图,可以显示一天中不同时间、一周中不同日期和方向的自行车交通密度模式。

波士顿自行车交通群图绘制了工作日、一天中的时间和行驶方向,以显示自行车租赁数量的密度。

按天和方向划分的自行车交通密度。

在自行车交通示例中,使用不同类型的图(如条形图、散点图和群图)可视化数据有助于我们从数据集中提取有用的信息,包括高峰交通日、通勤方向和一天中最繁忙的时间。

用MATLAB实现数据可视化

MATLAB是一个用于分析数据、开发算法和创建模型的编程和数值计算平台。它支持整个数据分析工作流,包括直接将数据获取到MATLAB中;分析并可视化该数据;和导出结果。你可以使用交互式应用程序在不编写任何代码的情况下可视化数据;这些应用程序将自动为您生成适当的MATLAB代码,因此您可以自动化并重用您的工作。

创建数据可视化

MATLAB提供了广泛的内置图表类型如折线图、散点图、分布图和地理图,以可视化来自不同应用程序集的数据集。您可以使用MATLAB语言以交互方式或编程方式创建可视化效果。

探索数据可视化

您可以交互式地浏览可视化效果,包括:

  • 放大和缩小数据集的特定部分
  • 交互式平移和旋转可视化
  • 直接在可视化上显示趋势线或数据值
  • 着色和高亮显示数据点
  • 域之间的切换(例如,时间、频率、S、Z域)

注释和自定义数据可视化

您可以通过突出显示希望传达的基本信息来交互式注释可视化效果,例如:

  • 注释关键数据点
  • 添加数据提示
  • 添加轴标签
  • 按不同颜色和图案分组
  • 添加数据标记、线样式和颜色

MATLAB会根据交互式图表修改自动生成代码。通过将该代码添加到脚本中,可以重用该代码。

I-Q信号图。x在x轴上,归一化振幅在y轴上。图中显示了同相信号和正交信号。

修改可视化效果时的“更新代码”选项。

使用简单的图表很难可视化复杂的数据集。MATLAB使您能够创建自定义图表以满足您的可视化需求并为其添加自定义交互。 

示例包括:

  • 迷你图组件—创建小折线图,显示多矢量数据集(如表)中每个矢量的一般趋势。观察并比较每行/每列的数据趋势。
  • 密度散点图使用颜色(或透明度)确定点的密度。
迷你图组件和密度散点图的屏幕截图,均绘制未标记的数据。

(左)迷你图组件和(右)密度散点图。

了解更多信息自定义图表容器的示例MATLAB Central上的文件交换。

导出数据可视化

您可以直接导出自定义和带注释的可视化效果,以便在web上、演示文稿和报告中使用。

显示保存到某个位置的图形的屏幕截图。

导出图形。

数据可视化与数据分析的集成

数据可视化通常与数据分析和预处理相结合。MATLAB应用程序,例如数据清理器信号分析仪,将这些步骤结合起来。

交互式控件允许您指定操作,而无需编写任何代码,相应的数据可视化直接集成在应用程序中。这允许您立即查看给定任务的结果。一旦您的分析和预处理完成,应用程序可以自动生成相应的MATLAB代码,以便您自动执行步骤,即使是在不同的数据上。

特定于应用程序的可视化

MATLAB工具箱提供特定于应用程序的可视化,以及将可视化与数据预处理和分析相结合的交互式应用程序。

Econometric Modeler应用程序的屏幕截图。

用于可视化和分析单变量或多变量时间序列数据的Econometric Modeler应用程序(在Econometrics Toolbox™中)。

震级响应图的屏幕截图,x轴上的频率单位为MHz,y轴上的震级。

多级数字下变频器各个级的频率响应(在DSP System Toolbox™中)。

图的屏幕截图,绘制了x轴上频率为GHz、y轴上为dBm的想要信号和干扰信号的频谱。

蓝牙LE阻塞、互调和载波干扰性能测试(在Bluetooth®工具箱中)。

相控阵系统的波束形成图形的屏幕截图,测量多个维度的归一化功率(dB)。

相控阵系统的波束形成(在phased array system Toolbox™中)。

MATLAB与其他数据可视化工具的连接

您可以使用MATLAB的计算和数据处理功能,使用其他商业智能工具创建可视化和仪表盘,例如:

案例研究部分

有趣的数据可视化应用程序

MATLAB中的数据可视化功能使组织能够有效地实现其研究目标。

福特开发分析驾驶循环测试结果的工具

福特的汽车能源管理工程团队使用MATLAB开发CycleTool来评估其汽车的排放、燃油经济性和性能。该工具使他们能够根据模型预测和仿真,通过可视化硬件测试结果来评估系统性能。

阅读故事

MATLAB的屏幕截图演示了根据模型预测和仿真可视化硬件测试结果的能力。

刷取数据以在摘要应用程序中找出趋势。

利用高速摄像机和风洞解码蝴蝶飞行

隆德大学(Lund University)的研究人员了解了是什么赋予蝴蝶独特的颤动模式,并使用MATLAB进行图像处理、数据分析、建模和可视化。通过研究蝴蝶的飞行行为,工程师可以建立更高效、更有活力的飞行甚至游泳机器人。研究人员使用MATLAB数据可视化功能分析和比较了他们的机翼设计的性能,这些设计灵感来自于他们对蝴蝶飞行行为的分析。

阅读故事

四张图表显示了不同的机翼类型,显示了标准化时间内的冲量和能量。

柔性机翼可提高拍击机翼的力和效率。

State Street Global Advisors开发评分模型,为ESG投资带来透明度

State Street Global Advisors的开发团队生成了直方图、散点图、方框图和其他可视化图,以完善算法,作为R-Factor™开发的一部分,R-Factor是一个帮助投资者做出明智决策并提高其环境、社会和治理(ESG)分数的系统。

阅读故事

十二个图表构成了一个直方图,显示了M S C I World按行业划分的R因子ESG得分。

按行业显示R-Factor ESG得分的柱状图。

博世开发了一个用于汽车测试数据分析和可视化的单一平台

博世公司使用MATLAB开发了ENValyzer(工程测试数据可视化和分析器),该工具用于可视化、处理、分析和生成从测量设备、测试台和车辆中获取的测试数据报告。博世工程师能够以单轴、二轴、矩阵图和多轴视图呈现数据。

阅读故事

ENValyzer图显示日珥比(PR)与R P M光谱结果。

ENValyzer图显示日珥比(PR)与RPM光谱结果。