数据可视化:高维数据的可视化
从数据科学家的角度来看,可以访问相关的数据可视化方法。“数据可视化”的旗舰思想是分类或非分类多变量数据的镜像密度图(MD图),发表在Thrun,M.C.等人:“分析分布的精细结构”(2020),PLoS ONE<doi:10.1371/journal.pone.0238835>. MD图优于ggplot2的盒须图(盒图)、小提琴图和豆子图以及geom_小提琴图。此外,还提供了各种单变量数据可视化方法的集合。在探索性数据分析的情况下,“数据可视化”可以通过四种方法的组合直观地检查数据集的每个特征的分布。其中一种方法是概率密度函数的帕累托密度估计(PDE)。此外,本文还介绍了使用PDE可视化距离分布、使用PDE对两个变量的散射密度图以及Shepard密度图和Bland-Altman图。关于分类的高维数据,描述了一些可视化,例如热图和轮廓图。通过国家或地区分类定义的附加信息,可以可视化世界或德国的政治地图。通过进一步扩展政治地图,可以使用Choopleth地图的简单功能,这对于跨地理区域的测量很有用。对于分类特征,经ABC分析改进的饼图、斜率图和扇形图可以使用。更多详细解释见M.C.特伦的书:《通过自我组织和群体智能实现基于投影的集群》(2018)<doi:10.1007/978-3658-20540-9>.
文档:
下载内容:
反向依赖关系:
链接:
请使用规范形式https://CRAN.R-project.org/package=数据可视化链接到此页面。