跳到主要内容
10.1145/3379597.3387462acm会议文章/章节视图摘要出版物页面国际证券交易所会议记录会议集合
研究论文

道德采矿:MSR采矿挑战案例研究

出版:2020年9月18日出版历史

摘要

挖掘软件存储库(MSR)研究是涉及人类主题的研究,因为存储库通常包含开发人员与存储库交互的数据。因此,该领域的任何研究都需要在开始之前考虑预期活动的道德含义。本文以2010年至2019年的采矿挑战为案例研究,探讨了MSR研究的伦理意义,以确定所使用的数据类型。它强调了人们在创建此类数据集时可能会遇到的问题,并基于当代研究伦理框架讨论了使用现有数据集时会遇到的伦理挑战。我们建议MSR社区应通过公开讨论已发表文章中的道德考虑来提高对道德问题的认识。

工具书类

  1. Le An、Ons Mlouki、Foutse Khomh和Giulian o Antoniol。2017年。堆栈溢出:代码清洗平台?。在SANER’17。283--293.谷歌学者谷歌学者交叉引用交叉引用
  2. Anneliese Amschler Andrews和Arundeep S.Pradhan。2001.经验软件工程中的道德问题:政策的限制。经验软件工程6,2(2001),105--110。谷歌学者谷歌学者数字图书馆数字图书馆
  3. 计算机协会(ACM)。2018.ACM道德和职业行为准则。https://www.acm.org/binaries/content/assets/about/acm-code-of-ethics-booklet.pdf(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  4. 杰夫·阿特伍德。2009.堆栈溢出Creative Commons数据转储。https://stackoverflow.blog/2009/06/04/stackoverflow-create-commons-data-dump/谷歌学者谷歌学者
  5. 阿尔贝托·巴切利。2013年,《2013年采矿挑战:堆栈溢出》。http://2013.msrconf.org/challenge.php谷歌学者谷歌学者
  6. 迪皮卡·巴达普迪。2017.在软件工程出版物中报告道德考虑因素。2017年ACM/IEEE国际经验软件工程与测量研讨会(ESEM)论文集。205--210.谷歌学者谷歌学者数字图书馆数字图书馆
  7. 塞巴斯蒂安·巴尔特斯。2019.软件开发人员的工作习惯和专业知识。博士论文。特里尔大学。谷歌学者谷歌学者
  8. 塞巴斯蒂安·巴尔特斯。2020年。SOTorrent数据集。https://experimental-software.engineering/projects/sotorrent网站/谷歌学者谷歌学者
  9. 塞巴斯蒂安·巴尔特斯和斯蒂芬·迪尔。2016年,比垃圾邮件更糟糕。第十届ACM/IEEE国际经验软件工程与测量研讨会(ESEM)论文集。arXiv:1707.00838谷歌学者谷歌学者数字图书馆数字图书馆
  10. 塞巴斯蒂安·巴尔特斯和斯蒂芬·迪尔。2019.GitHub项目中堆栈溢出代码段的使用和属性。经验软件工程24,3(2019年6月),1259--1295。arXiv:1802.02938号谷歌学者谷歌学者数字图书馆数字图书馆
  11. 塞巴斯蒂安·巴尔特斯(Sebastian Baltes)、洛里克·杜马尼(Lorik Dumani)、克里斯托夫·特劳德(Christoph Treude)和斯蒂芬·迪尔(Stephan Diehl)。2018年。SOTorrent。第15届国际采矿软件库会议(MSR)论文集。319到330。arXiv公司:1803.07311谷歌学者谷歌学者
  12. 塞巴斯蒂安·巴尔特斯(Sebastian Baltes)、克里斯托夫·特劳德(Christoph Treude)和斯蒂芬·迪尔(Stephan Diehl)。2019.SOTorrent:研究堆栈溢出代码段的起源、演变和使用。在IEEE/ACM第16届国际采矿软件库会议(MSR)上。191-194.arXiv:1809.02814谷歌学者谷歌学者数字图书馆数字图书馆
  13. 奥尔加·贝萨尔。2014年,采矿挑战。http://2014.msrconf.org/challenge.php谷歌学者谷歌学者
  14. BCS:特许信息技术协会,2015年。BCS成员行为准则。https://cdn.bcs.org/bcs-org-media/2211/bcs-code-of-conduct.pdf(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  15. 莫里茨·贝勒、乔治奥斯·古西奥斯和安迪·扎伊德曼。【未注明日期】。TravisTorrent:综合Travis CI和GitHub,对持续集成进行全面研究。在IEEE/ACM第14届国际采矿软件库会议(MSR)上。447--450.谷歌学者谷歌学者
  16. 莫里茨·贝勒(Moritz Beller)、乔治奥斯·古西奥斯(Georgios Gousios)和安迪·扎伊德曼(Andy Zaidman)。2017年,采矿挑战。http://2017.msrconf.org/#/challenge谷歌学者谷歌学者
  17. 拉奎尔·本布南(Raquel Benbunan-Fich)。2017.对毫无戒心的用户进行在线研究的道德规范:从A/B测试到C/D实验。《研究伦理学》13,3-4(2017),200-218。谷歌学者谷歌学者交叉引用交叉引用
  18. 大卫·M·贝里。2004年,《互联网研究:隐私、道德和异化:开源方法》。互联网研究14,4(2004),323--332。谷歌学者谷歌学者交叉引用交叉引用
  19. 英国教育研究协会。2018年,《教育研究伦理准则》,第4版。https://www.bera.ac.uk/publication/ethical-guidelines-for-educational-research-2018(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  20. 埃伦·布劳德、阿曼达·史密斯和彼得·威尔斯。2017.帮助组织在其数据实践中解决道德问题(白皮书)。开放数据研究所。https://www.scribd.com/document/358778144/ODI-道德-数据处理-2017-09-13(上次访问时间:2019年11月2日)。谷歌学者谷歌学者
  21. 2018年加利福尼亚州议会。第375号国会法案——加利福尼亚州消费者隐私法案。谷歌学者谷歌学者
  22. 尼克·克拉弗。2018.Stack Exchange Data Explorer中的列名Age无效(答案)。https://meta.stackoverflow.com/questions/368976/invalid-column-name-age-in-stack-exchange-data-explorer#369002谷歌学者谷歌学者
  23. Creative Commons[未注明日期]。CC0 1.0通用。https://creativecommons.org/publicdomain/zero/1.0/legalcode谷歌学者谷歌学者
  24. Debian[未注明日期]。隐私政策。https://www.debian.org/legal/privacy网站谷歌学者谷歌学者
  25. Debian[未注明日期]。终极Debian数据库。https://wiki.debian.org/UltimateDebian数据库/谷歌学者谷歌学者
  26. 萨利·丹奇、罗恩·伊普霍芬和乌苏拉·胡斯。2004年,《欧盟社会经济研究道德规范》。英国就业研究所。http://www.respectproject.org/ethics/412ethics.pdf。谷歌学者谷歌学者
  27. Stephan Diehl、Sebastian Baltes和Christoph Treude。2019.采矿挑战。https://2019.msrconf.org/track/msr-2019-Mining-Challenge?track=msr%20%20Mining%20Challenge谷歌学者谷歌学者
  28. David Dittrich和Erin Kennelly。2012年,《门罗报告:指导信息和通信技术研究的道德原则》。https://www.dhs.gov/sites/default/files/publications/CSD-MenloPrinciplesCORE-20120803_1.pdf(上次访问时间为2019年10月29日)。谷歌学者谷歌学者
  29. David Dittrich和Erin Kennelly。2013年,《应用道德原则指导信息和通信技术研究:Menlo报告指南》。https://www.dhs.gov/sites/default/files/publications/CSD-MenloPrinciplesCOMPANION-20120103-r731_1.pdf(上次访问时间为2019年10月29日)。谷歌学者谷歌学者
  30. 罗伯特·戴尔。2013年,利用Boa将超大型软件库挖掘带给大众。博士论文。爱荷华州立大学。谷歌学者谷歌学者
  31. Robert Dyer、Hoan Anh Nguyen、Hridesh Rajan和Tien N.Nguyen。2013年,Boa:用于分析超大型软件库的语言和基础设施。在第35届国际软件工程会议(ICSE)上。422--431.谷歌学者谷歌学者
  32. Robert Dyer、Hoan Anh Nguyen、Hridesh Rajan和Tien N.Nguyen。2015.Boa:超大规模软件库和源代码挖掘。ACM软件工程与方法汇刊25,1(2015年12月)。谷歌学者谷歌学者交叉引用交叉引用
  33. 2017年Eclipse基金会。Eclipse Foundation软件用户协议。https://www.eclipse.org/legal/epl/notice.php网址谷歌学者谷歌学者
  34. 2019年Eclipse基金会。Eclipse.org使用条款。https://www.eclipse.org/legal/termsofuse.php谷歌学者谷歌学者
  35. 哈立德·埃曼。2001.道德与开源。经验软件工程6,4(2001),291--292。谷歌学者谷歌学者数字图书馆数字图书馆
  36. 经验软件工程[n.d.]。遵守道德标准。https://www.springer.com/journal/10664/submission-guidelines#Instruction%20for%20Authors_Compliance%20with%20Ethical%20标准谷歌学者谷歌学者
  37. 自由软件基金会。【未注明日期】。各种许可证及其注释。https://www.gnu.org/licenses/license-list.en.html(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  38. 自由软件基金会。【未注明日期】。什么是自由软件?https://www.gnu.org/philosophy/free-sw.html(上次访问时间为2019年10月28日)。谷歌学者谷歌学者
  39. D.M.德语。2004年。挖掘CVS存储库,软更改体验。在采矿软件库(MSR)国际研讨会上。17--21.谷歌学者谷歌学者
  40. 唐·戈特伯恩。2001.软件工程道德规范和专业实践。《科学与工程伦理学》7,2(2001年6月),231--238。谷歌学者谷歌学者交叉引用交叉引用
  41. 乔治奥斯·古西奥斯(Georgios Gousios)。2013年。GHTorent数据集和工具套件。在第十届挖掘软件存储库工作会议上。233--236.谷歌学者谷歌学者数字图书馆数字图书馆
  42. 特蕾西·霍尔和瓦莱丽·弗林。2001.软件工程研究中的道德问题:当前实践调查。经验软件工程6,4(2001年12月),305-317。谷歌学者谷歌学者数字图书馆数字图书馆
  43. 大卫·J·汉德。2018年,变化世界中的数据道德方面:我们现在在哪里?大数据6,3(2018)。谷歌学者谷歌学者
  44. 亚伯兰·欣德尔(Abram Hindle)。2010年,2010年MSR采矿挑战赛。http://2010.msrconf.org/challenge/谷歌学者谷歌学者
  45. Abram Hindle、Israel Herraiz、Emad Shihab和Zhen Ming Jiang。2010年,采矿挑战2010:FreeBSD、GNOME Desktop和Debian/Ubuntu。在第七届IEEE挖掘软件库(MSR)工作会议上。82--85.谷歌学者谷歌学者
  46. 尼尔·克什特里和杰弗里·沃斯。2020年,关于一般数据保护法规和在线人体监测的思考。计算机53,1(2020年1月),86-90。谷歌学者谷歌学者交叉引用交叉引用
  47. 安妮特·马卡姆(Annette Markham)和伊丽莎白·布坎南(Elizabeth Buchanan)。2012年,《道德决策和互联网研究:AoIR道德工作委员会的建议》(2.0版)。https://aoir.org/reports/ethics2.pdf(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  48. 富兰克林·米勒和唐纳德·罗森斯坦。2002年,在医学研究出版物中报告伦理问题。《柳叶刀》360,9342(2002年10月),1326-1328。谷歌学者谷歌学者交叉引用交叉引用
  49. 国家生物医学和行为研究受试者保护委员会。1979年,《贝尔蒙特报告:保护人类研究对象的伦理原则和指南》。https://www.hhs.gov/ohrp/regulations-and-policy/belmont-report/read-the-belmont-port/index.html(上次访问时间为2019年11月2日)。谷歌学者谷歌学者
  50. Hoan Nguyen和Robert Dyer。2016年,采矿挑战。http://2016.msrconf.org/#/challenge谷歌学者谷歌学者
  51. 克里斯托弗·厄兹别克(Christopher Oezbek)。2008.研究开源项目的研究道德。FOSDEM第四研究室会议记录。网址:http://www.inf.fu-berlin.de/~oezbek/pub/oezbek C08_ResearchEthicsForOSS.pdf(上次访问时间:2019年11月3日)。谷歌学者谷歌学者
  52. 美国卫生与公共服务部。1996年,《1996年健康保险便携性和责任法案》,P.L.第104-191号。谷歌学者谷歌学者
  53. 开源指南。【未注明日期】。开源的法律方面。https://opensource.guide/legal网站/(上次访问时间为2019年11月2日)。谷歌学者谷歌学者
  54. 开源指南。【未注明日期】。开源指标。https://opensource.guide/metrics网站/(最后一次访问时间为2019年11月3日)。谷歌学者谷歌学者
  55. 开源倡议。【未注明日期】。按名称列出的许可证。https://opensource.org/licenses/alpherical网址(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  56. 开源倡议。【未注明日期】。开源定义(带注释)。https://opensource.org/osd-注释(上次访问时间为2019年10月28日)。谷歌学者谷歌学者
  57. Matheus Paixao、Jens Krinke、Dongyun Han和Mark Harman。2018.CROP:将代码评审与源代码更改联系起来。在第15届国际采矿软件库会议记录中。46--49.谷歌学者谷歌学者数字图书馆数字图书馆
  58. 塞巴斯蒂安·普罗克什。【未注明日期】。KaVE项目。网址:http://www.kave.cc/谷歌学者谷歌学者
  59. 塞巴斯蒂安·普罗克什。2017.丰富的事件流:软件开发人员In-IDE活动实证研究的通用平台。博士论文。达姆施塔特科技大学。谷歌学者谷歌学者
  60. 塞巴斯蒂安·普罗克什(Sebastian Proksch)、斯文·阿曼(Sven Amann)和莎拉·纳迪(Sarah Nadi)。2018.丰富的活动流。第15届国际采矿软件库会议(MSR)论文集。62--65.谷歌学者谷歌学者数字图书馆数字图书馆
  61. 塞巴斯蒂安·普罗克什(Sebastian Proksch)、斯文·阿曼(Sven Amann)和莎拉·纳迪(Sarah Nadi)。2018年,采矿挑战。https://2018.msrconf.org/track/msr-2018-迷你挑战谷歌学者谷歌学者
  62. C.Ragkhitwetsagul、J.Krinke、M.Paixao、G.Bianco和R.Oliveto。2019.烟囱溢出有毒代码片段。IEEE软件工程学报(2019年)。谷歌学者谷歌学者
  63. 格雷戈里奥·罗伯斯(Gregorio Robles)、劳拉·阿乔纳·雷纳(Laura Arjona Reina)、亚历山大·塞雷布雷尼克(Alexander Serebrenik)、波格丹·瓦西列斯库(Bogdan Vasilescu)和杰苏斯·冈萨雷斯(Jesüs M.Gonzá。2014年。FLOSS 2013:关于自由软件贡献者的调查数据集:管理、共享和合并的挑战。第十一届挖掘软件库(MSR)工作会议记录。396--399.谷歌学者谷歌学者
  64. 阿德里安·施罗德。2011年,2011年MSR挑战赛。在第八届采矿软件存储库工作会议上。谷歌学者谷歌学者
  65. 阿德里安·施罗德。2011年,采矿挑战。http://2011.msrconf.org/msr-challenge.html谷歌学者谷歌学者
  66. 埃马德·什哈布(Emad Shihab)。2012年,采矿挑战。http://2012.msrconf.org/challenge.php谷歌学者谷歌学者
  67. Emad Shihab、Yasutaka Kamei和Pamela Bhattacharya。2012年,2012年采矿挑战:Android平台。第九届IEEE挖掘软件库(MSR)工作会议。112--115.谷歌学者谷歌学者交叉引用交叉引用
  68. 贾妮斯·辛格和诺曼·文森。2001.为什么以及如何研究道德对你很重要。是的,你!经验软件工程6,4(2001),287--290。谷歌学者谷歌学者
  69. 贾妮斯·辛格(Janice Singer)和诺曼·G·文森(Norman G.Vinson)。2002.软件工程实证研究中的伦理问题。IEEE Trans。柔和。工程28、12(2002年12月),1171--1180。谷歌学者谷歌学者数字图书馆数字图书馆
  70. 软件遗产档案。【未注明日期】。软件遗产:镜子的道德宪章。https://www.softwareheritage.org/legal/mirrors-ethical-charter网站/(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  71. 软件遗产档案。【未注明日期】。软件遗产:使用存档数据的道德宪章。https://www.softwareheritage.org/legal/users-ethical-charter网站/(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  72. 软件遗产档案。【未注明日期】。软件遗产:批量访问的使用条款。https://www.softwareheritage.org/legal/bulk-访问-使用条款/(上次访问时间:2019年11月3日)。谷歌学者谷歌学者
  73. Bernd Carsten Stahl、Job Timmermans和Brent Daniel Mittelstadt。2016年,《计算伦理:面向计算的文献综述》。计算。调查48,4(2016年2月)。谷歌学者谷歌学者数字图书馆数字图书馆
  74. Lisa Sugiura、Rosemary Wiles和Catherine Pope。2017.在线研究中的道德挑战:公共/私人认知。《研究伦理学》13,3-4(2017),184-199。谷歌学者谷歌学者交叉引用交叉引用
  75. 英国心理学会。2014.人类研究道德规范。谷歌学者谷歌学者
  76. 英国心理学会。2018.道德与行为准则。谷歌学者谷歌学者
  77. 欧洲议会和欧盟理事会。2016.《一般数据保护条例》(EU)2016/679。《欧盟官方公报》(2016)。https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32016R0679(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  78. 2012年FreeBSD项目。FreeBSD的隐私政策。https://www.freebsd.org/privacy.html谷歌学者谷歌学者
  79. Linux基金会。2018年,自由和开源软件项目GDPR概念总结。https://www.linuxfoundation.org/wp-content/uploads/2018/05/lf_gdpr_052418.pdf(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  80. TestRoots团队2020。TravisTorrent:免费开放Travis Analytics for Everyone。https://travistorrent.testroots.org网站谷歌学者谷歌学者
  81. 丹尼尔·托马斯(Daniel R.Thomas)、塞尔吉奥·帕斯特拉纳(Sergio Pastrana)、爱丽丝·哈钦斯(Alice Hutchings)、理查德·克莱顿(Richard Clayton)和阿拉斯泰尔·贝雷斯福德(Alastair R.Beresford)。2017.使用非法来源数据集进行研究的道德问题。在ACM SIGCOMM互联网测量会议(IMC)的会议记录中。谷歌学者谷歌学者
  82. Leanne Townsend和Claire Wallace。2016年,《社交媒体研究:道德指南》。https://www.gla.ac.uk/media/media_487729_smxx.pdf(上次访问时间为2019年11月3日)。谷歌学者谷歌学者
  83. Travis CI[未注明日期]。隐私政策。https://docs.travis-ci.com/legal/隐私政策/谷歌学者谷歌学者
  84. Anne-Marie Tuikka、Chau Nguyen和Kai K.Kimppa。2017.与使用网络图作为研究方法相关的道德问题。轨道杂志1,2(2017年10月)。谷歌学者谷歌学者
  85. 诺曼·文森和珍妮斯·辛格。2001.了解道德问题的根源。经验软件工程6,4(2001),293--297。谷歌学者谷歌学者数字图书馆数字图书馆
  86. 诺曼·G·文森和贾妮斯·辛格。2008年,《人类伦理研究实用指南》。在《高级经验软件工程指南》中,Forrest Shull、Janice Singer和Dag I.K.Sjöberg(编辑)。施普林格伦敦,第9章,229-256。谷歌学者谷歌学者
  87. 安妮·英。2015年,采矿挑战。http://2015.msrconf.org/challenge.php谷歌学者谷歌学者

索引术语

  1. 道德采矿:MSR采矿挑战案例研究

        建议

        评论

        登录选项

        检查您是否可以通过登录凭据或您的机构访问本文。

        登录

        完全访问权限

        • 发布于

          封面图片ACM会议
          MSR'20:第17届采矿软件存储库国际会议论文集
          2020年6月
          675页
          国际标准图书编号:9781450375177
          内政部:10.1145/3379597

          版权所有©2020 ACM

          如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

          出版商

          计算机协会

          美国纽约州纽约市

          出版历史

          • 出版:2020年9月18日

          权限

          请求有关此文章的权限。

          请求权限

          检查更新

          限定符

          • 研究论文
          • 研究
          • 推荐有限公司

          即将召开的会议

          ICSE 2025年
          2025 IEEE/ACM第46届国际软件工程会议
          2025年4月26日至5月3日
          渥太华,打开,加拿大

        PDF格式

        以PDF文件查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器