-
可用工件 :此徽章用于在永久位置发布的工件(带有DOI)。 无需评估工件即可获得此徽章。 -
评估的工件 :此徽章适用于OOPSLA工件评估委员会(AEC)批准的工件。 徽章有两个级别; 论文最多可以接收其中一个: -
功能 对于发现有文档记录的工件,一致、完整、可执行,并包括适当的验证和确认证据 -
可重复使用的 用于功能性工件,并通过仔细的文档和清晰的组织促进重用。
-
-
验证结果:再现结果 用于复制论文主要科学主张的人工制品。
常见问题解答
问:我的工件需要数百GB的RAM/数百个CPU小时/一个专门的GPU等,AEC成员可能无法访问。我们如何提交工件? 如果该工具可以在普通的现代机器上运行,但与用于论文评估的硬件相比,运行速度可能非常慢,请记录预期的运行时间,并举出AEC可以在更短的时间内复制的示例。 如果您的系统在没有数百GB或RAM或其他典型机器无法满足的硬件要求的情况下根本无法工作,请 提前联系AEC主席进行安排 一种选择是从云提供商处获取合适的硬件(例如, 云实验室 ),并提供审阅者 匿名的 访问。 (AEC主席将与审查人员协调,以决定何时需要激活云保留。)使用云实例或类似实例的提交,如果没有事先得到AEC主席的批准,将被立即拒绝 问:如果论文中的一些主张没有得到工件的支持,例如,如果省略了一些基准,或者工件不包括我们在论文中进行实验比较的工具,那么我的工件可以被接受吗? 一般来说是的(如果提供了良好的解释,如上所述),但如果这些声明对论文的总体结果至关重要,则工件将被拒绝。 作为一个极端的例子,一个带有工作工具但没有基准的工件(因为它们是封闭源代码的)将被拒绝。 在这种情况下,应提供替代基准。 问:为什么我们需要一个可用徽章的DOI? 为什么不是Github或机构URL? DOI是工件无限期可用的有力保证。 相比之下,Github URL并不是永久的:可以在公共存储库中重写git提交历史(使用 重新设置基址 和 --力 例如),用户可以删除公共存储库,Github本身可能会像GoogleCode一样消失 (2015) 。机构URL也可能随着时间推移而移动和更改。 问题:审查人员确定了要在我们工件的文档或脚本中修复的问题,我们希望 发布固定版本。 我们可以提交Available徽章的改进版本吗? 对。 问:我可以在不提交神器的情况下获得可用徽章吗? 我仍在做这件事! 对。 问:我可以为未被判定为功能性的工件获得可用徽章吗? 我仍在做这件事! 对。 问:为什么AEC不接受纸质校样? AEC过程是为软件而设计的,而不是为纸样提供严格的评估。 它的主要优点是检查工件是否成功运行,以及是否与纸张有明确的关系,这两者都不是纸张校样的严重问题。 作者应将此类证明作为补充材料提交,而不是作为人工制品提交。
联系人
要求人工制品
-
可用工件 :此徽章用于在永久位置发布的工件(带有DOI)。 无需评估工件即可获得此徽章。 -
评估的工件 :此徽章适用于OOPSLA工件评估委员会(AEC)批准的工件。 徽章有两个级别; 论文最多只能收到其中一个: -
功能 对于发现有文档记录的工件,一致、完整、可执行,并包括适当的验证和确认证据 -
可重复使用的 用于功能性工件,并通过仔细的文档和清晰的组织促进重用。
-
-
验证结果:再现结果 ,用于复制论文主要科学主张的人工制品。
今年
OOPSLA AEC将授予 再现的结果 徽章以及 功能性/可重复使用 徽章。 作者应添加 硬件相关性 部分描述评估工件所需的硬件。 作者应添加 可重用性指南 在工件的描述中。 我们很高兴将软件遗产作为宿主和引用源代码的一种方式进行推广。 作者和AEC成员之间的交流将在 整个的 通过提交网站上的评论来打发时间。 鼓励AEC成员尽早报告问题,以便作者有足够的时间进行调试。 不接受纸质校样进行评估。
可用工件
未提交评估的工件 可以 可用, 未通过评估的工件 可以 可用,以及 通过评估的工件 不需要 可以适应作者必须将工件保密的罕见情况。
选项1:作者将工件的快照上传到 泽诺多 接收DOI。 上传可以手动完成,或者 通过GitHub . 选项2:作者与Conference Publishing合作,将他们的工件发送到ACM,以便在ACM DL上托管。
数据可用性声明
\章节{结论} .... \第*节{数据可用性声明} 支持~\cref{s:design,s:evaluation}的软件 在Software Heritage ~\cite{artifact-swh}上提供 和Zenodo~\cite{artifact-doi}。 \开始{acks} ....
软件遗产
指向目录、文件和代码片段的永久链接 BibLaTeX样式 用于引用软件 自动爬网源代码存储库以获取更新
评估的工件
-
已记录 :至少应包括工件清单,并提供足够的描述,以便执行工件。 -
一致 :工件与相关论文相关,并以某种固有的方式生成其主要结果。 -
完成 :在可能的范围内,包括与所讨论论文相关的所有组件。 -
可行使的 :可以成功执行用于在相关文件中生成结果的包含脚本和/或软件,并且可以访问和适当操作包含的数据。
清楚地解释工件的功能(例如,通过示例), 包含高质量的文档化代码(例如,README、注释、测试), 记录如何使工件适应新输入,以及 打包以使其能够作为另一个项目中的组件重用。
结果已验证
-
一些基准代码受到许可或知识产权限制,无法合法地与审查人员共享(例如,SPEC等许可的基准套件,或当工具应用于私有代码时)。 在这种情况下,应包括公共基准。 如果主要索赔的所有基准数据都是私有的,则应提供替代数据 。提供没有有意义的输入来评估的工具不足以证明工件有效。 -
一些结果是性能数据,因此确切的数字取决于特定的硬件。 在这种情况下,工件应该解释如何识别其他硬件上的实验何时再现高级结果。 例如,某些优化可能会表现出特定的趋势,或者一个工具可能在某类输入中优于另一个工具。 -
重复评估需要很长时间。 如果是这样的话,提供小的和有代表性的输入来演示行为。 在这种情况下,评审员可能会也可能不会复制完整的结果。 -
评估需要专用硬件(例如,具有特定新功能的CPU、特定类别的GPU或GPU集群)。 作者应提供有关如何访问硬件或尽快联系椅子的说明,以确定如何进行评估。 在过去几年中,一个结果是,一个需要专用硬件的工件用硬件支付了云实例的费用,审查人员可以匿名访问。
选择标准
一致的 用纸, 作为 完成 尽可能, 另外其文档也很齐全 ,以及 易于重复使用 ,促进进一步研究。
提交过程
工件概述, 指向以下任一项的非机构URL: 包含工件的单个文件(推荐),或 公共源代码管理存储库的地址
在提交时验证工件版本的散列:或者 单个文件的md5散列(使用md5或md5sum命令行工具生成散列),或 这个 满的 提交存储库的散列(例如,来自 git重新登录--无bbrev )
工件概述
简介, 硬件依赖项部分, 入门指南,以及 关于如何评估工件功能的分步说明(与论文的相关部分有适当的联系)。 一份可重用性指南,介绍如何评估工件的可重用性。
包装工件
-
将工件打包的一个好方法是作为虚拟机(VM)。 虚拟机提供了一个易于复制的环境,对比特腐烂有一定的抵抗力。它们还使审查人员相信错误或其他问题不会对他们的机器造成损害。 我们建议您提供为x86和ARM构建的虚拟机,以便审查人员可以在与其个人计算机匹配的任何体系结构上运行虚拟机。 -
源代码工件应该使用Docker或其他构建工具来管理所有编译和依赖项。 这提高了审核人员能够快速、轻松地安装工件的几率,而不会因环境问题而迷失方向( 例如,我需要什么Python?! ). -
机械化防伪制品应遵循本页上的指南: 验证工件(访问日期:2023-10-02) 。一定要解释机械化是如何对论文中的概念和定理进行编码的。 根据我们的经验,机械化工件很难在不可重用的情况下满足Functional单独的需求,因为文档对于理解工件是否忠实地支持论文至关重要。
审查流程概述
踢腿时间
全面审查
COI公司
常见问题
在kick-the-tires阶段
翻转平台支架。 一些声称只需要类UNIX系统的工件在macOS下严重失败,尤其是那些需要32位编译器的工件,这些编译器在较新的macOS版本中不再存在。 我们建议未来的工件将其声称的支持范围缩小。 缺少依赖项,或依赖项文档不完善。 提前避免这类问题的最有效方法是在新的机器、VM或Docker容器上独立运行指令。
在全面审查阶段
在新基准上与现有工具进行比较,但不包括复制其他工具执行的方法。 没有解释如何解释结果。 几个工件成功运行,并生成了作为论文基础的输出,但没有任何方法供审阅者比较这些输出与论文的一致性。 示例包括生成一个警告列表,但不记录哪些是真的,哪些是假阳性,以及生成大量数字表,这些数字表在论文中以图形方式呈现,但没有提供生成类似可视化的方法。 我们建议使用脚本生成数据和实验图形。 这种完全自动化的方法的设置成本可能要高一些,但您的纸张不会有任何复制/粘贴问题,而且重新生成数据也大大简化了。