计算机科学>数据结构和算法
标题: 使用专家验证从众包比较中排序
摘要: 我们引入了一种新的噪声排序模型,该模型是由实验心理学中的JND模型激发而来的。 我们模型的目标是捕获从众包环境中收集的低质量数据。 与其他著名的噪声排序模型相比,我们的模型不依赖于精确的数据生成假设,并捕获了众包任务的不同难度,这可能会导致数据中出现不同数量的噪声。 为了处理这项具有挑战性的任务,我们假设可以使用专家建议验证一些收集的数据。 该验证程序成本高昂; 因此,我们的目标是最小化我们使用的验证次数。 我们提出了一种新的有效算法,称为候选排序,我们证明了该算法在我们考虑的噪声排序模型中使用了最佳验证次数。 我们通过表明它在参数$k$中是线性的来表征这种最佳验证次数,该参数直观地测量了众包数据中错误但并非不一致的最大比较次数。