研究论文

MeSHProbeNet-P：使用个性化MeSH探针改进大规模MeSH索引

作者：
光绪勋

弗吉尼亚州夏洛茨维尔弗吉尼亚大学

弗吉尼亚州夏洛茨维尔弗吉尼亚大学
查看个人资料

,
基什莱贾

弗吉尼亚州夏洛茨维尔弗吉尼亚大学

弗吉尼亚州夏洛茨维尔弗吉尼亚大学
查看个人资料

,
张爱东

弗吉尼亚州夏洛茨维尔弗吉尼亚大学

弗吉尼亚州夏洛茨维尔弗吉尼亚大学
查看个人资料

作者信息和声明

ACM数据知识发现事务第15卷第1版条款编号：11第1-14页https://doi.org/10.1145/3421713

出版：2020年12月7日出版历史

检查交叉标记上的更新

ACM数据知识发现事务

摘要

用医学主题标题（MeSH）索引生物医学研究文章可以极大地促进生物医学研究和信息检索。目前，MeSH索引由人工专家执行。为了减轻手动索引带来的时间消耗和金钱成本，开发了许多自动MeSH索引模型，如MeSHProbeNet、DeepMeSH和NLM的官方模型Medical Text Indexer。在本文中，我们提出了一个端到端框架MeSHProbeNet-P，它使用可个性化的MeSH探测来扩展MeSHProbeNet。在MeSHProbeNet-P中，每个MeSH探针都携带生物医学知识的某些方面，并从输入文章中提取相关信息。MeSHProbeNet-P能够针对不同的输入文章自动个性化其MeSH探测，以确保当前的MeSH探测器最适合当前的输入文章，并且可以从文章中提取信息量最大的特征。我们演示了MeSHProbeNet-P在实际大规模MeSH索引挑战中的有效性。MeSHRoberteNet-P在2019年BioASQ挑战赛中获得第一批任务A的第一名。本文报告了挑战的第一个测试集的结果。我们还提供消融研究，以显示个性化MeSH探针的优势。

工具书类

Alan R.Aronson、James G.Mork、Clifford W.Gay、Susanne M.Humphrey和Willie J.Rogers。2004年，NLM索引倡议的医学文本索引器。第11届世界医学信息学大会会议记录。Marius Fieschi、Enrico W.Coiera和Jack Yu-Chan Li（编辑），第107卷。IOS出版社，268--272。内政部：https://doi.org/10.3233/978-1-60750-949-3-268谷歌学者
Dzmitry Bahdanau、Kyunghyun Cho和Yoshua Bengio。2014年，通过联合学习对齐和翻译实现神经机器翻译。Arxiv预印Arxiv:1409.0473（2014）。谷歌学者
约舒亚·本吉奥（Yoshua Bengio）、霍尔格·施温克（Holger Schwenk）、吉安·塞巴斯蒂安·塞内卡尔（Jean-Sébastien Senécal）、弗雷德里克·莫林（Fréderic Morin）和吉安·卢克·高文。2006年，神经概率语言模型。在机器学习的创新中。施普林格，137-186。谷歌学者
Kyunghyun Cho、Bart van Merrienboer、Dzmitry Bahdanau和Yoshua Bengio。2014.关于神经机器翻译的特性：编码器-解码器方法。第八届统计翻译中的句法、语义和结构研讨会论文集。103--111. 检索自http://aclweb.org/antology/W/W14/W14-4012.pdf。谷歌学者交叉引用
钟俊英（Junyoung Chung）、卡格拉·古尔切里（Caglar Gulcehre）、赵京贤（KyungHyun Cho）和约书亚·本吉奥（Yoshua Bengio）。2014.门控递归神经网络对序列建模的实证评估。Arxiv预印Arxiv:1412.3555（2014）。谷歌学者数字图书馆
傅燕杰、刘俊明、李小林和熊慧。2018.用于应用程序内服务使用分析的多标签多视图学习框架。ACM智能系统与技术汇刊9，4（2018年1月），24。内政部：https://doi.org/10.1145/3151937谷歌学者数字图书馆
Vishrawas Gopalakrishnan、Kishlay Jha、Guangxu Xun、Hung Q.Ngo和Aidong Zhang。2017.生物医学文本领域基于自学的假设生成。生物信息学34，12（2017），2103--2115。谷歌学者交叉引用
何开明、张湘玉、任少清、孙建军。2016.图像识别的深度残差学习。IEEE计算机视觉和模式识别会议论文集。770--778.谷歌学者交叉引用
高黄、李一轩、杰夫·普莱斯、刘庄、约翰·霍普克罗夫特和基利安·温伯格。2017年。快照合奏：第1列，免费获得M。Arxiv预印Arxiv:1704.00109（2017）。谷歌学者
Kishlay Jha、光绪勋、Vishrawas Gopalakrishnan和Aidong Zhang。2017.通过生物医学应用的外部知识库增加单词嵌入。2017年IEEE国际大数据会议论文集。IEEE，1965-1974年。谷歌学者交叉引用
Qiao Jin、Bhuwan Dhingra、William Cohen和Xinghua Lu.2018。注意MeSH：简单、有效、可解释的自动MeSH索引器。第六届BioASQ研讨会论文集：大规模生物医学语义索引和问答挑战。47-56。谷歌学者交叉引用
Aris Kosmopoulos、Ioannis Partalas、Eric Gaussier、Georgios Paliouras和Ion Androutsopoulos。2015年，等级分类评估措施：统一观点和新颖方法。数据挖掘和知识发现29，3（2015），820--865。谷歌学者数字图书馆
Quoc V.Le和Tomas Mikolov。2014.句子和文件的分布式表示。第31届国际机器学习会议论文集。第14卷。1188--1196.谷歌学者
Yann LeCun、Yoshua Bengio和Geoffrey Hinton。2015年，深度学习。《自然》5217553（2015），436。谷歌学者
李昕、李东冰、魏林和贝施。2018.目标导向情绪分类的转型网络。Arxiv预印Arxiv:1805.01086（2018）。谷歌学者
Jimmy J.Lin和W.John Wilbur。2007.PubMed相关文章：基于主题的内容相似性概率模型。BMC生物信息学8（2007），483。内政部：https://doi.org/10.1186/1471-2105-8-423谷歌学者交叉引用
周汉林、冯敏伟、西塞罗·诺盖拉·多斯桑托斯、莫玉、炳湘、周伯文和约舒亚·本吉奥。2017.结构化自我关注句子嵌入。Arxiv预印Arxiv:1703.03130（2017）。谷歌学者
刘珂、彭胜文、吴俊秋、翟成祥、马美泽和朱山峰。2015.MeSHLabeler：通过整合各种证据提高大规模MeSH索引的准确性。生物信息学31，12（2015），339--347。内政部：https://doi.org/10.1093/bioinformatics/btv237谷歌学者交叉引用
托马斯·米科洛夫（Tomas Mikolov）、伊利亚·萨茨克沃（Ilya Sutskever）、陈凯（Kai Chen）、格雷格·科拉多（Greg S.Corrado）和杰夫·迪恩（Jeff Dean）。2013.单词和短语的分布式表示及其组成。神经信息处理系统进展论文集。3111--3119.谷歌学者数字图书馆
James G.Mork、Antonio Jimeno-Yepes和Alan R.Aronson。2013.NLM医学文本索引器系统，用于索引生物医学文献。在评估论坛（CLEF'13）会议和实验室的会后研讨会《第一届生物医学语义索引和问答研讨会论文集》中。阿克塞尔·西里尔·恩贡加·恩戈莫和乔治·帕柳拉斯（编辑），第1094卷。CEUR-WS.org.检索自http://ceur-ws.org/Vol-1094/ibiosq2013_submission_3.pdf。谷歌学者
彭胜文、尤荣辉、王洪宁、翟成祥、马美泽和朱山峰。2016。DeepMeSH：用于改进大规模MeSH索引的深度语义表示。生物信息学32，12（2016），70-79。内政部：https://doi.org/10.1093/bioinformatics/btw294谷歌学者交叉引用
Lei Tang、Suju Rajan和Vijay K.Narayanan。2009年。通过metalabeler进行大规模多标签分类。第18届万维网国际会议论文集。美国医学会，211-220。谷歌学者
乔治·萨萨罗尼斯（George Tsatsaronis）、乔治奥斯·巴利卡斯（Georgios Balikas）、马拉卡西奥提斯（Prodromos Malakasiotis）、伊奥尼斯·帕塔拉斯（Ioannis Partalas）、马蒂亚斯·兹孔克（Matthias Zschunke）、迈克尔·R·阿尔维斯（Michael R.Alvers）、德克·魏森博恩（Dirk Weissenborn）、安娜斯塔西娅·克里塔拉（Anastasia Krithara）、塞尔吉奥斯·佩蒂迪斯（Sergios Petridis）、迪米特里斯·多时，莉莉亚娜·巴里奥·阿尔弗斯（Liliana Barrio-Alvers）、迈克尔·施罗德（Michael Schroeder）、伊恩·安德洛索普洛斯（Ion Androutsopoulos）和乔治奥斯·帕利乌拉斯（Georgios Paliouras）。2015年，BIOASQ大型生物医学语义索引和问答比赛综述。BMC生物信息学16（2015），138。内政部：https://doi.org/10.1186/s12859-015-0564-6谷歌学者交叉引用
阿什什·瓦斯瓦尼（Ashish Vaswani）、诺姆·沙泽尔（Noam Shazeer）、尼基·帕尔玛（Niki Parmar）、雅各布·乌斯科雷特（Jakob Uszkoreit）、利昂·琼斯（Llion Jones）、艾丹·戈麦斯（Aidan N.Gomez）、尤卡斯·凯泽（ukasz Kais。2017年。你所需要的就是关注。神经信息处理系统进展论文集。5998--6008.谷歌学者
光绪勋（Guangxu Xun）、基什莱·贾（Kishlay Jha）、维什拉瓦斯·戈帕拉克里什南（Vishrawas Gopalakrishnan）、李亚良（Yaliang Li）和张爱东（Aidong Zhang）。2017.基于进化医学概念生成医学假设。2017年IEEE数据挖掘国际会议（ICDM’17）论文集。IEEE，535--544。谷歌学者交叉引用
光绪勋、基什莱·贾、叶远、王亚庆和张爱东。2019.MeSHProbeNet：用于MeSH索引的自关注探测网。生物信息学35，19（2019年3月），3794-3802。内政部：https://doi.org/10.1093/bitinformatics/btz142谷歌学者
荀光旭、李亚良、高静、张爱东。2017.通过协调全球和本地上下文，合作改进主题发现和单词嵌入。第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集。美国医学会，535--543。谷歌学者数字图书馆
荀光旭、李亚良、赵欣、高静、张爱东。2017.使用单词嵌入的相关主题模型。第26届国际人工智能联合会议论文集。谷歌学者交叉引用
叶远、荀光旭、所秋玲、贾可斌、张爱东。2017.Wave2vec：学习生物信号的深度表示。2017年IEEE数据挖掘国际会议（ICDM’17）论文集。IEEE，1159--1164。谷歌学者交叉引用
郑乐成、于成和何景瑞。2019.多任务多视角学习的深度多模态模型。2019年SIAM国际数据挖掘会议记录。暹罗，10-18岁。谷歌学者交叉引用
姚周和何景瑞。2017年。多视角下的随机众包方法。2017年IEEE数据挖掘国际会议（ICDM’17）论文集。IEEE，685--694。谷歌学者交叉引用
朱珊凤、贾曾和马美泽。2009.通过合并MeSH语义相似度增强MEDLINE文档聚类。生物信息学25,15（2009），1944-1951。谷歌学者数字图书馆

索引术语

MeSHProbeNet-P：使用个性化MeSH探针改进大规模MeSH索引
1. 计算方法
  1. 人工智能
    1. 自然语言处理
      1. 信息提取
2. 信息系统
  1. 信息检索
    1. 文件表示法
      1. 同义词表
    2. 检索任务和目标
      1. 聚类和分类

建议

基于注意的乌尔都语命名实体识别Bi-LSTM-CRF模型
计算智能的进展
摘要
命名实体识别（NER）任务是自然语言处理（NLP）中一个具有挑战性的问题，尤其是对于像乌尔都语这样注释语料库很少的语言。本文提出了一种Attention-Bi-LSTM-CRF方法，并将其应用于实际。。。
阅读更多信息
基于BERT的带注意机制和Lambda层的生物医学命名实体识别模型
ICMLC’24：2024年第16届机器学习和计算国际会议记录

生物医学命名实体识别（NER）是自然语言处理（NLP）中信息提取领域的一个关键子任务。它的主要目标是识别和分类生物医学文本中的实体，在。。。
阅读更多信息
呼吸道传染病文本命名实体识别的改进注意机制和对抗训练
人工神经网络和机器学习——ICANN 2023
摘要
生物医学文本的命名实体识别是一项有意义的任务。它从非结构化文本数据中提取医疗实体。随着深度学习的发展，注意机制与深度学习的结合已成为研究的热点。。。 $^{}$
阅读更多信息

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此文章

发布于
ACM数据知识发现事务第15卷第1期
2021年2月
361页
国际标准编号：1556-4681
EISSN公司：1556-472倍
内政部：10.1145/3441647
编辑：
查鲁·阿加瓦尔
IBM T.J.Watson Research，美国
,
吴新东
中国明珠科学院
问题目录
版权所有©2020 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2020年12月7日
- 认可的：2020年8月1日
- 修订过的：2020年7月1日
- 收到：2020年3月1日
发布于tkdd公司第15卷第1期

权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
大型
注意机制
生物医学MeSH索引
深度学习
限定符
- 研究论文
- 研究
- 推荐
会议
资金来源
其他指标
查看文章指标

文章指标
- 1
  引文总数
  查看引文
- 158
  总下载次数
- 下载次数（过去12个月）23
- 下载次数（最近6周）0
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

电子阅读器

使用eReader联机查看。

电子阅读器

HTML格式

以HTML格式查看本文。

查看HTML格式

查看问题目录