矿石

来自MyaWiki.Org
跳转到导航 跳到搜索

矿石/Z z/〔1〕提供的Web服务和API机器学习 作为服务维基媒体项目的维护得分平台球队. 该系统旨在帮助自动化关键的维基工作-例如,破坏性检测和去除。目前,矿石生成的两种一般类型是“编辑质量”和“文章质量”。

矿石是一种后端服务,并不能直接提供一种利用分数的方法。如果你想使用矿石分数,请检查我们的使用矿石分数的工具列表. 如果矿石不支持你的维基,请参阅我们的请求支持说明.

寻找关于矿石的问题的答案吗?退房矿石常见问题.

编辑质量

矿石编辑质量流程。从“互联网”到维基百科的编辑描述图描述了矿石前的“未知”质量和“好”、“需要审查”、“损害”的标签,这是在矿石可用之后可能发生的。

维基媒体开放项目最关键的问题之一是审查潜在的破坏性贡献(“编辑”)。还需要确认善意的捐赠者(他们可能无意中造成损害)并提供他们的支持。这些模型的目的是使过滤工作通过特殊:渐变更容易进食。我们为编辑质量预测模型提供两个层次的支持:基本的和高级的。

基础保障

假设最有害的编辑将是回复的不伤害的编辑不会回复的我们可以利用Wiki的编辑历史(恢复编辑)来构建。该模型易于建立,但存在着由于破坏和破坏而造成许多编辑恢复的问题。为了帮助,我们创建了一个基于坏词的模型.

  • 回复的-预测编辑是否最终会被还原。

超前支护

我们可以要求编辑培训那些事实上是编辑的矿石。破坏性的哪些编辑看起来像是被保存在诚信. 这需要在社区中的志愿者的部分额外的工作,但它提供了一个更准确和细微的预测关于编辑的质量。许多工具只有在目标Viki的高级支持可用时才起作用。

  • 破坏性的-预测编辑是否造成损坏
  • 诚信-预测编辑是否以善意保存


文章质量

英文维基百科评估表。提出了由WP 1 BOT生成的英文维基百科评估表(如DEC 2014)的截图。

维基百科文章的质量是维基人的核心关注点。新的网页必须审查和策划,以确保垃圾邮件,破坏和攻击文章不留在维基。对于在最初的策展中幸存下来的文章,一些维基人定期评估文章的质量,但这是劳动密集型的,评估往往是过时的。

策展支持

越严重的问题类型的草案被删除,越好。策划新的页面创作可以做很多工作。就像编辑中的反恶意破坏问题一样,机器预测可以帮助策展人首先关注最有问题的新页面。基于管理员在删除页面时留下的注释(参见测井工作台我们可以训练一个模型来预测哪些页面需要快速删除。EP:WP:CSD对于一个快速删除维基百科英语的原因列表。对于英语模型,我们使用G3“破坏”G10“攻击”G11“垃圾邮件”.

  • 制图质量-预测文章是否需要快速删除(垃圾邮件、破坏、攻击或OK)

评定量表支持

对于在最初的策展中幸存下来的文章,一些大型维基百科使用一个与之大致相当的刻度来周期性地评估文章的质量。英文维基百科1评定等级表(“质量”)。有了这些评估是非常有用的,因为它帮助我们衡量我们的进步和识别错过的机会(例如,低质量的流行文章)。然而,保持这些评估最新是具有挑战性的,因此覆盖面不一致。这里就是文章质量机器学习模型很有用。通过训练一个模型来复制人类执行的文章质量评估,我们可以用计算机自动评估每一篇文章和每一次修订。该模型已被用来帮助维基项目分流重新评估工作,并探讨编辑动态,导致文章质量的改善。

文章的质量模型基于对文章结构特征的预测。有多少节?有信息箱吗?参考文献有多少?引用是否使用{{引用}模板?文章质量模型不评价写作的质量或是否存在音调问题(例如一个观点被推动)。然而,许多文章的结构特征似乎与良好的写作和语气强烈相关,因此模型在实践中很好地工作。

  • 文章质量-预测一篇文章或草稿的(维基百科1.0类)评估等级

支持表

下表通过Wiki和可用的模型报告矿石支持的状态。如果你没有看到你的维基上市,或者支持你想使用的模型,你可以请求支持.

当前支持: HTTPS://TooS.WMFABABS.Org/RES-Posiv-ChistList/

API使用

矿石提供宁静的用于动态检索关于修订的评分信息的API服务。HTTPS://Or.Wikimdidia. ORG有关如何使用API的更多信息。

如果您正在查询有关大量修订的服务,则建议在每个请求中批次50次修订,如下所述。使用最多4个并行请求是可以接受的。对于更大数量的查询,您可以在本地运行矿石。

实例查询: HTTP://Or.WMFABABS.OR/V3/SCORES/EnWiKi/?模型=制图质量WP10和ReVID=34854345×485104318


实例查询: HTTPS://Or.Wikimdia.Org/V3/SCORES/WIKIDATAWIKI/42106984/损坏

局部使用

在本地运行矿石,可以安装矿石。

PIP安装矿石α需要Python 3,与Python 2不相容。

那么你应该能够运行它

回声-e“{RevIdID”:456789 }\n{RevsIdID:3242342 } γ矿石评分修订版:HTTPS://Or.Wikimdia.Org EnWiKi损伤

你应该看到输出


脚注

  1. γ 最初的客观修订评价服务这个长长的名字现在被弃用了。