×

使用缩略图为初学者学习数据争论提供便利的API查找。 (英语) Zbl 07805172号

摘要:随着对数据科学技能的需求不断增长,以编程方式处理数据的能力成为一个关键障碍。在本文中,我们讨论了API(应用程序编程接口)查找对数据争论的中心性,以及本体结构的命令菜单如何促进它。我们设计缩略图作为解释数据争论操作的视觉替代方案,并使用调查来验证其质量。我们进一步预测,缩略图会使菜单更易于导航,从而提高查找效率和性能。我们的预测通过Slice N Dice进行了测试,Slice N Dice是一个收集学习者活动的在线数据争论辅导平台。它包括非程序性和程序性数据争论练习。来自多机构样本(n=200)的参与者被随机分配到有或没有缩略图的教程中。我们的结果表明,缩略图减少了澄清的需要,从而帮助初学者学习数据争论的API查找。我们进一步提出了一些关于性能提升的负面结果,并随后讨论了为什么这些差异是细微的,以及如何加以改进。最后但并非最不重要的是,我们用一项定性研究来补充我们的统计结果,在该研究中,我们从参与者那里获得了关于缩略图的设计和有用性的积极反馈。

MSC公司:

68-01 与计算机科学相关的介绍性说明(教科书、教程论文等)
62-04 统计相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] V.M.AleksićIvanović,欧洲高等教育的入门课程,《教育信息学》,第15期,第163-182页(2016年)·doi:10.15388/infedu.2016.09
[2] A.C.J.E.C.A.D.Bart Tibau Tilevich Shaffer Kafura,Blockpy:面向初级程序员的开放存取数据科学环境,《计算机》,50,18-26(2017)·doi:10.1109/MC.2017.132
[3] B.Baumer,本科生数据科学课程:用数据思考,《美国统计学家》,69,334-342(2015)·Zbl 07671751号 ·doi:10.1080/00031305.2015.1081105
[4] Y.Z.Ben-David Kolikant ma'ayan,《计算机科学学生为学术目的使用互联网:困难和学习过程》,计算机科学教育,28,211-231(2018)·doi:10.1080/08933408.2018.1528045
[5] J.Brandt、P.J.Guo、J.Lewenstein、M.Dontcheva和S.R.Klemmer,《机会主义编程的两项研究:交叉网络搜索、学习和编写代码》SIGCHI计算机系统人为因素会议记录, 2009, 1589-1598.
[6] J.E.S.D.Broatch Dietrich Goelman,《通过连接数据库概念和dplyr引入数据科学技术》,《统计教育杂志》,27,147-153(2019)·doi:10.1080/10691898.2019.1647768
[7] M.Cembalo、A.De Santis和U.Ferraro Petrillo,Savi:高级sql可视化的新系统2011年信息技术教育会议记录, 2011, 165-170.
[8] CrowdFlower,2016年数据科学报告,http://www2.cs.uh.edu/ceick/UDM/CFDS16.pdf,2016,[在线;2021年5月10日访问]。
[9] T.Diamantopoulos、G.Karagiannopoulos和A.L.Symeonidis,《代码捕获:从在线源中提取源代码片段》,in第六届实现软件工程中人工智能协同作用国际研讨会论文集, 2018, 21-27.
[10] B.A.C.Dorn Stankiewicz Roggi,《在搜索中迷失:终端用户程序员在信息搜索中的困难》,《美国信息科学与技术学会学报》,第50期,第1-10页(2013年)·doi:10.1002/meet.14505001059
[11] I.Drosos、T.Barik、P.J.Guo、R.DeLine和S.Gulwani,《Wrex:为数据科学家合成可读代码的统一编程示例交互》2020年CHI计算机系统人为因素会议记录, 2020, 1-12.
[12] T.Erickson、M.Wilkerson、W.Finzer和F.Reichsman,《数据移动》,统计教育中的技术创新, 12 (2019).
[13] H.Fangohr,《c、matlab和python作为工程教学语言的比较》国际计算科学会议,施普林格,2004年,1210-1217。
[14] K.A.T.福兰德,viSQLizer:用于学习SQL的交互式可视化工具,挪威科技大学硕士论文,2016年。
[15] G.Gao、F.Voichick、M.Ichinco和C.Kelleher,探索程序员的api学习过程:收集网络资源作为外部内存,in2020年IEEE视觉语言与以人为本计算研讨会(VL/HCC),IEEE,2020,1-10。
[16] M.Ichinco、W.Y.Hnin和C.L.Kelleher,《向具有示例大师的新手程序员建议api用法》,in2017 CHI计算机系统人为因素会议记录, 2017, 1105-1117.
[17] M.Ichinco和C.Kelleher,《改进支持与区块示例交互的必要性》2017 IEEE Blocks and Beyond研讨会(B&B)IEEE,2017年,69-70。
[18] S.J.C.J.F.N.H.C.B.D.Kandel Heer Plaisant Kennedy Van Ham Riche Weaver Lee Brodbeck Buono,《数据争论中的研究方向:可用和可信数据的可视化和转换》,信息可视化,10,271-288(2011)·数字对象标识代码:10.1177/1473871611415994
[19] S.Kandel、A.Paepcke、J.Hellerstein和J.Heer,《牧马人:数据转换脚本的交互式可视化规范》SIGCHI计算机系统人为因素会议记录, 2011, 3363-3372.
[20] C.Kelleher和M.Ichinco,面向API学习模型2019年IEEE视觉语言与以人为本计算研讨会(VL/HCC)IEEE,2019年,163-168年。
[21] R.Kimball,数据争论,信息管理,18,8(2008)
[22] A.J.Ko和Y.Riche,概念知识在api可用性中的作用2011年IEEE视觉语言与以人为本计算研讨会(VL/HCC)IEEE,2011年,第173-176页。
[23] S.K.Krishnamurthi Fisler,《以数据为中心:计算机教育的挑战和机遇》,《ACM通信》,63,24-26(2020)·数字对象标识代码:10.1145/3408056
[24] S.Kross和P.J.Guo,《工业和学术界教授数据科学的实践者:期望、工作流程和挑战》2019年CHI计算机系统人为因素会议记录, 2019, 1-14.
[25] W.McKinney,用于数据分析的Python:与Pandas、NumPy和IPython的数据纠错,“O”Reilly Media,Inc.”,2012年。
[26] J.C.O.O.Nesbit Adesope,《用概念和知识地图学习:元分析》,《教育研究评论》,76413-448(2006)·数字对象标识代码:10.3102/00346543076003413
[27] H.I.Y.Niu Keivanloo Zou,《学习对代码搜索引擎的代码示例进行排名》,《实证软件工程》,22,259-291(2017)·doi:10.1007/s10664-015-9421-5
[28] A.M.Olney和S.D.Fleming,《数据科学块语言设计的认知负荷视角》2019 IEEE Blocks and Beyond研讨会(B&B),IEEE,2019,95-97。
[29] A.Paivio,《心理表征:双重编码方法》(1990)·doi:10.1093/acprof:oso/9780195066661.001.0001
[30] N.Paton,自动化数据准备:我们可以吗?我们应该吗?必须吗?,在里面第21届大数据设计、优化、语言和分析处理国际研讨会, 2019, 1-5.
[31] D.B.H.Qiu Li Leung,《理解java中的api用法》,《信息与软件技术》,73,81-100(2016)·doi:10.1016/j.infsof.2016.01.011
[32] R工作室,R工作室作弊表,https://github.com/rstudio/cheatsheets网站,2021,[在线;2021年6月3日访问]。
[33] D.Schuff,《面向所有人的数据科学:大学范围内的数据素养课程》分析与数据科学,施普林格,2018年,281-297。
[34] B.Shneiderman,《编程教学:语法和语义的螺旋方法》,计算机与教育,193-197(1977)·doi:10.1016/0360-1315(77)90008-2
[35] H.A.Simon,《结构不良问题的结构》,人工智能,4181-201(1973)·doi:10.1016/0004-3702(73)90011-8
[36] S.Sosnovsky和T.Gavrilova,面向c编程的教育本体开发第十一届国际会议第1卷,2005年,127。
[37] L.Sundin和Q.Cutts,《利用电子学习研究中的图形化子目标发现引入数据争论》第八届ACM学习量表会议记录, 2021, 267-270.
[38] P.蒂托,R食谱:经验证的数据分析、统计和图形食谱,“O”Reilly Media,Inc.”,2011年。
[39] K.S.E.A.J.Thayer Chasins Ko,健壮api知识理论,ACM计算教育学报(TOCE),21,1-32(2021)·doi:10.1145/34444945
[40] Tidyblocks.tech、Tidyblocks、,https://github.com/tidyblocks/tidyblock,2021,[在线;于2021年2月21日访问]。
[41] D.温伯格,一切都是杂乱无章的:新数字混乱的力量,麦克米伦出版社,2007年。
[42] D.Weintrop和U.Wilensky,阻止还是不阻止,这是一个问题:学生对基于块的编程的看法第十四届交互设计与儿童国际会议论文集, 2015, 199-208.
[43] H.Wickham和G.Grolemund,数据科学R:导入、整理、转换、可视化和建模数据,“O”Reilly Media,Inc.”,2016年。
[44] X.Zhang和P.J.Guo,Ds.js:在第30届ACM用户界面软件与技术研讨会会议记录, 2017, 691-702.
[45] Y.L.M.P.Y.M.R.Zhu Hernandez-Mueller Dong Forman,《人类研究中的数据采集和预处理:统计学课上没有教什么?》?,《美国统计学家》,67,235-241(2013)·Zbl 07649213号 ·doi:10.1080/00031305.2013.842498
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。