采矿挑战
自2006年以来,采矿软件库国际工作会议(MSR)主办了一次采矿挑战。面对这一挑战,我们呼吁所有感兴趣的人应用他们的工具,通过分析一个通用数据集,将研究和工业紧密联系在一起。挑战在于勇敢地将采矿工具和方法付诸实践的研究人员和从业者。
今年的挑战开始了比较和组合不同的信息源,上堆栈溢出数据集。堆栈溢出在用户、研究人员甚至竞赛中广受欢迎(例如。,2013年MSR挑战和卡格尔). 成为一个协作编辑的问答网站计算机编程,Stack Overflow自然适合不同的信息源:自然来自问题和帖子内容的语言文本;帖子中的代码片段;投票和声誉用户数量;以及元数据,如用户提供的标签、发布日期等。我们邀请您前来使用问题并呈现以下结果比较至少两个涉及单个设置的设置信息源或信息源的组合。
例如,如果您对预测新堆栈溢出问题的投票数,一个可能的挑战是比较三种设置对数字的预测能力堆栈溢出问题的投票数:仅自然语言文本,仅代码片段,以及文本和代码片段的组合。下面是另一个例子:如果你对学习感兴趣这个堆栈溢出答案中代码片段的可读性,一个可能的挑战提交是调查周围文本的可读性和用户的声誉代码片段的可读性。
如何参与挑战
参与挑战需要您:
1下载数据。
2报告你在一份四页的文件中的发现。
三。提交您于2015年2月27日或之前提交的报告
4.如果您的报告被接受,请在2015年MSR上展示您令人敬畏的发现!
挑战数据
我们为您提供最新的堆栈溢出内容的官方数据转储(2014年9月26日更新),由提供在Internet存档上堆叠Exchange。此数据包括问题历史记录并以XML格式回答帖子、标签、帖子上的投票以及海报的声誉。对于模式,您可以参考Stack Exchange上的帖子.另一个有用的资源是堆栈Exchange数据浏览器它允许您直接针对数据副本发出SQL查询在线。堆栈溢出数据根据Creative Commons BY-SA 3.0许可证.Stack Exchange的David Fullerton的博客文章提供了有关许可证的更多信息。
当您使用MSR 2015挑战赛提供的数据时,我们要求您引用如下:
@进行中{2015年MSR挑战,author={Annie T.T.Ying},title={2015年采矿挑战:比较和合并不同信息堆栈溢出数据集}上的源,booktitle={第十二届挖掘软件库工作会议},年份={2015年},页面={显示}}
挑战报告
挑战报告应通过介绍正在解决的问题,所述信息源被比较和组合,方法和使用的工具、结果及其含义和结论。请记住,报告将由陪审团评估。确保你的报告突出了你的贡献和重要性工作。
质询报告的长度不得超过4页,并且在提交时必须符合ICSE(和MSR)2015格式和提交指南。
提交详细信息
将您的挑战报告(最多4页)提交给Easy椅子2015年2月27日或之前。拜托向“MSR 2015挑战赛道”提交挑战报告。作者通知和摄像日期分别是3月16日和3月30日。
提交供审议的论文不应在其他地方发表,也不应在审议期间审查或提交其他地方审查。ACM剽窃对于重复提交的情况,应遵循政策和程序。
收到接受通知后,将要求接受论文的所有作者填写ACM版权形式,并将收到有关准备相机就绪版本的进一步说明。至少预计每篇论文的一位作者将在2015年MSR会议上介绍结果。全部已接受贡献将在会议电子会议记录中公布。
奖项
我们很感激IBM研究的赞助了今年的采矿挑战赛。最佳团队将被授予价值200美元的用法IBM Bluemix云平台和200美元奇客思考礼券。
致谢
StackOverflow数据由提供Internet存档上托管的堆栈Exchange.