×

可视化双变量循环时间粒度的概率分布。 (英语) Zbl 07546456号

摘要:将时间索引分解为时间粒度可以帮助探索和自动分析大型时间数据集。本文描述了使用线性和循环时间粒度的时间解构类。线性粒度与时间的线性进展有关,例如小时、天、周和月。周期性粒度可以是圆形的,如每天的小时,准圆形的,例如每月的日,非周期性的,如公共假日。粒度的层次结构创建了一个嵌套的顺序:一天中的小时和一分钟中的秒是单序的。一周中的每小时是多个顺序的,因为它是一天中的一天。提供了为时间索引创建所有可能粒度的方法。推荐算法提供了一个指示,指示一对粒度是可以一起进行有意义的检查(“和谐”),还是不能一起检查(“冲突”)。时间粒度可用于创建数据可视化,以探索周期性、关联性和异常。粒度形成分类变量(有序或无序),从而导致观察分组。假设是一个数值响应变量,则得到的图形显示了分类变量组合之间的分布比较。开源R包gravitas中实现的方法与整洁的工作流一致,使用中可用的图形范围检查概率分布ggplot2。可在线获取本文的补充文件。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾格纳,W。;Miksch,S。;舒曼,H。;Tominski,C.,《面向时间的数据可视化》(2011),伦敦:施普林格科学与商业媒体,伦敦
[2] Allaire,J。;谢毅。;J.麦克弗森。;卢拉斯基,J。;Ushey,K。;阿特金斯,A。;Wickham,H。;Cheng,J。;Chang,W。;Iannone,R.(2020)
[3] Bettini,C。;De Sibi,R.,“用户定义时间粒度的符号表示”,《数学和人工智能年鉴》,30,53-92(2000)·Zbl 1050.68599号 ·doi:10.1023/A:1016686623228
[4] Bettini,C。;Dyreson,C.E。;埃文斯,W.S。;雪草,R.T。;Wang,X.S。;O.Etzion。;贾约迪亚,S。;Sripada,S.,《时间数据库:研究与实践,时间粒度概念词汇表》,406-413(1998),柏林:施普林格-柏林-海德堡,柏林
[5] Bettini,C。;贾约迪亚,S。;Wang,S.,《数据库中的时间粒度、数据挖掘和时间推理》,Springer Science&Business Media(2000),柏林:Springer出版社,柏林·Zbl 0976.68049号
[6] 环境与能源部(2018)
[7] Dyreson,C。;Evans,W。;Lin,H。;Snodgrass,R.,“有效支持时间粒度”,IEEE知识与数据工程汇刊,12568-587(2000)
[8] 古德温,S。;戴克斯,J.(2012)
[9] 格罗蒙德,G。;Wickham,H.,“使用Lubridate简化日期和时间,统计软件杂志,40,1-25(2011)·doi:10.18637/jss.v040.2003
[10] 格罗蒙德,G。;Wickham,H.,R for Data Science(2017),加利福尼亚州塞巴斯托波尔:加利福尼亚州塞瓦斯托波尔O'Reilly Media
[11] 古普塔,S。;Hyndman,R。;库克,D。;Unwin,A.(2020年)
[12] Hintze,J.L。;Nelson,R.D.,“小提琴情节:盒子情节——密度痕迹协同作用”,《美国统计学家》,52,181-184(1998)
[13] 霍夫曼,H。;Wickham,H。;Kafadar,K.,“字母值图:大数据的箱线图,计算与图形统计杂志,26,469-477(2017)
[14] Hyndman,R.J.,“计算和绘制最高密度区域,美国统计学家,50,120-126(1996)
[15] Laird Smith,J.(2020)
[16] McGill,R。;Tukey,J.W。;Larsen,W.A.,“方框图的变化”,《美国统计学家》,32,12-16(1978)
[17] 宁,P。;Wang,X.S。;Jajodia,S.,“日历的代数表示,数学和人工智能年鉴,36,5-38(2002)·兹比尔1001.68034 ·doi:10.1023/A:1015835418881
[18] 波特,K。;Kniss,J。;Riesenfeld,R。;Johnson,C.R.,“可视化摘要统计和不确定性”,计算机图形学论坛,29823-832(2010)
[19] R核心团队,R:A Language and Environment for Statistical Computing(2020),奥地利维也纳:R统计计算基金会,奥地利维也纳
[20] Reingold,E.M。;Dershowitz,N.,《历法计算》(2018),剑桥:剑桥大学出版社,剑桥·Zbl 1403.01001号
[21] Tukey,J.W.,探索性数据分析(1977),雷丁,马萨诸塞州:艾迪森·韦斯利,雷丁·Zbl 0409.62003号
[22] 沃恩·D(2020)
[23] 王,E。;库克,D。;Hyndman,R.J.,“基于日历的图形用于可视化人们的日常日程,计算与图形统计杂志,29,490-502(2020)·Zbl 07499291号
[24] 王,E。;库克,D。;Hyndman,R.J.,“支持时间数据探索和建模的新潮流数据结构,计算与图形统计杂志,29,466-478(2020)·Zbl 07499289号
[25] Wickham,H.,Ggplot2:数据分析的优雅图形(2016),纽约:Springer-Verlag,纽约·Zbl 1397.62006年
[26] Wickham,H。;斯特里杰夫斯基(2012)
[27] Wilke,C.O.(2020年)
[28] Wilkinson,L.,《图形语法》(1999),纽约:施普林格出版社,纽约·Zbl 0940.68158号
[29] Xie,Y.,《带R和knitr的动态文档》(2015),佛罗里达州博卡拉顿:查普曼和霍尔/CRC,佛罗里达州波卡拉顿
[30] 谢毅(2020)
[31] 谢毅。;Allaire,J。;Grolemund,G.,R Markdown:The Definitional Guide(2018),佛罗里达州博卡拉顿:查普曼和霍尔/CRC,佛罗里达州波卡拉顿
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。