Automatic tagging with existing and novel tags

Wang, Junhui; Shen, Xiaotong; Sun, Yiwen; Qu, Annie

doi:10.1093/biomet/asx016

S公司摘要

关键词和短语的自动标注在文档的多标签分类中非常重要。在本文中，我们首先引入了一种标记损失来衡量预测标签集和实际标签集之间的差异，这种差异用两个标签之间的加权成对裕度之和来表示，即它们的相似程度。然后，我们构造一个正则化的经验损失来合并语言知识，并识别一个标记器，最大化两两边缘之间的分隔。该方法的一个显著特点是，它能够通过使用与现有标签的相似性来识别训练样本中缺少的新标签。在计算上，该方法通过交替方向乘法器方法实现，并与差分凸算法相结合。这允许可伸缩的计算。我们表明，该方法实现了准确的标记，并且与现有方法相比具有优势。最后，我们将该方法应用于路透社新闻数据集的标记。

您当前没有访问此文章的权限。

下载所有幻灯片

月份：	总浏览次数：
2017年4月	27
2017年5月	81
2017年6月	42
2017年7月	51
2017年8月	59
2017年9月	20
2017年10月	22
2017年11月	29
2017年12月	17
2018年1月	23
2018年2月	9
2018年3月	34
2018年4月	15
2018年5月	30
2018年6月	17
2018年7月	8
2018年8月	20
2018年9月	20
2018年10月	21
2018年11月	17
2018年12月	4
2019年1月	9
2019年2月	5
2019年3月	5
2019年4月	20
2019年5月	1
2019年6月	16
2019年7月	7
2019年8月	20
2019年9月	41
2019年10月	16
2019年11月	14
2019年12月	2
2020年1月	4
2020年2月	1
2020年3月	5
2020年4月	7
2020年5月	2
2020年6月	38
2020年7月	29
2020年9月	1
2020年10月	2
2020年11月	14
2020年12月	10
2021年1月	8
2021年2月	三
2021年3月	5
2021年4月	5
2021年5月	7
2021年6月	12
2021年7月	14
2021年8月	5
2021年9月	2
2021年10月	2
2021年11月	7
2021年12月	7
2022年1月	1
2022年3月	8
2022年4月	8
2022年8月	8
2022年9月	2
2022年10月	6
2022年11月	三
2022年12月	1
2023年1月	4
2023年2月	1
2023年4月	2
2023年5月	2
2023年6月	2
2023年7月	1
2023年8月	1
2023年9月	5
2023年10月	2
2023年11月	1
2023年12月	1
2024年1月	4
2024年2月	三
2024年3月	5

使用现有标签和新标签进行自动标记

S公司摘要

引文

意见

海拔高度

电子邮件警报

通过引用文章

最新的

阅读次数最多

被引用次数最多

使用现有标签和新标签进行自动标记

S公司摘要

登录

个人账户

机构准入

机构账户管理

获取访问帮助

机构准入

基于IP的访问

通过您的机构登录

使用图书卡登录

协会成员

通过社交网站登录

使用个人帐户登录

个人账户

查看您的登录帐户

已登录但无法访问内容

机构账户管理

购买

短期访问

租金

引文

意见

海拔高度

电子邮件警报

通过引用文章

最新的

阅读次数最多

被引用次数最多

此功能仅对订阅服务器可用