跳到主要内容
研究论文

MeSHProbeNet-P:使用个性化MeSH探针改进大规模MeSH索引

出版:2020年12月7日出版历史
跳过抽象节

摘要

用医学主题标题(MeSH)索引生物医学研究文章可以极大地促进生物医学研究和信息检索。目前,MeSH索引由人工专家执行。为了减轻手动索引带来的时间消耗和金钱成本,开发了许多自动MeSH索引模型,如MeSHProbeNet、DeepMeSH和NLM的官方模型Medical Text Indexer。在本文中,我们提出了一个端到端框架MeSHProbeNet-P,它使用可个性化的MeSH探测来扩展MeSHProbeNet。在MeSHProbeNet-P中,每个MeSH探针都携带生物医学知识的某些方面,并从输入文章中提取相关信息。MeSHProbeNet-P能够针对不同的输入文章自动个性化其MeSH探测,以确保当前的MeSH探测器最适合当前的输入文章,并且可以从文章中提取信息量最大的特征。我们演示了MeSHProbeNet-P在实际大规模MeSH索引挑战中的有效性。MeSHRoberteNet-P在2019年BioASQ挑战赛中获得第一批任务A的第一名。本文报告了挑战的第一个测试集的结果。我们还提供消融研究,以显示个性化MeSH探针的优势。

工具书类

  1. Alan R.Aronson、James G.Mork、Clifford W.Gay、Susanne M.Humphrey和Willie J.Rogers。2004年,NLM索引倡议的医学文本索引器。第11届世界医学信息学大会会议记录。Marius Fieschi、Enrico W.Coiera和Jack Yu-Chan Li(编辑),第107卷。IOS出版社,268--272。内政部:https://doi.org/10.3233/978-1-60750-949-3-268谷歌学者谷歌学者
  2. Dzmitry Bahdanau、Kyunghyun Cho和Yoshua Bengio。2014年,通过联合学习对齐和翻译实现神经机器翻译。Arxiv预印Arxiv:1409.0473(2014)。谷歌学者谷歌学者
  3. 约舒亚·本吉奥(Yoshua Bengio)、霍尔格·施温克(Holger Schwenk)、吉安·塞巴斯蒂安·塞内卡尔(Jean-Sébastien Senécal)、弗雷德里克·莫林(Fréderic Morin)和吉安·卢克·高文。2006年,神经概率语言模型。在机器学习的创新中。施普林格,137-186。谷歌学者谷歌学者
  4. Kyunghyun Cho、Bart van Merrienboer、Dzmitry Bahdanau和Yoshua Bengio。2014.关于神经机器翻译的特性:编码器-解码器方法。第八届统计翻译中的句法、语义和结构研讨会论文集。103--111. 检索自http://aclweb.org/antology/W/W14/W14-4012.pdf。谷歌学者谷歌学者交叉引用交叉引用
  5. 钟俊英(Junyoung Chung)、卡格拉·古尔切里(Caglar Gulcehre)、赵京贤(KyungHyun Cho)和约书亚·本吉奥(Yoshua Bengio)。2014.门控递归神经网络对序列建模的实证评估。Arxiv预印Arxiv:1412.3555(2014)。谷歌学者谷歌学者数字图书馆数字图书馆
  6. 傅燕杰、刘俊明、李小林和熊慧。2018.用于应用程序内服务使用分析的多标签多视图学习框架。ACM智能系统与技术汇刊9,4(2018年1月),24。内政部:https://doi.org/10.1145/3151937谷歌学者谷歌学者数字图书馆数字图书馆
  7. Vishrawas Gopalakrishnan、Kishlay Jha、Guangxu Xun、Hung Q.Ngo和Aidong Zhang。2017.生物医学文本领域基于自学的假设生成。生物信息学34,12(2017),2103--2115。谷歌学者谷歌学者交叉引用交叉引用
  8. 何开明、张湘玉、任少清、孙建军。2016.图像识别的深度残差学习。IEEE计算机视觉和模式识别会议论文集。770--778.谷歌学者谷歌学者交叉引用交叉引用
  9. 高黄、李一轩、杰夫·普莱斯、刘庄、约翰·霍普克罗夫特和基利安·温伯格。2017年。快照合奏:第1列,免费获得M。Arxiv预印Arxiv:1704.00109(2017)。谷歌学者谷歌学者
  10. Kishlay Jha、光绪勋、Vishrawas Gopalakrishnan和Aidong Zhang。2017.通过生物医学应用的外部知识库增加单词嵌入。2017年IEEE国际大数据会议论文集。IEEE,1965-1974年。谷歌学者谷歌学者交叉引用交叉引用
  11. Qiao Jin、Bhuwan Dhingra、William Cohen和Xinghua Lu.2018。注意MeSH:简单、有效、可解释的自动MeSH索引器。第六届BioASQ研讨会论文集:大规模生物医学语义索引和问答挑战。47-56。谷歌学者谷歌学者交叉引用交叉引用
  12. Aris Kosmopoulos、Ioannis Partalas、Eric Gaussier、Georgios Paliouras和Ion Androutsopoulos。2015年,等级分类评估措施:统一观点和新颖方法。数据挖掘和知识发现29,3(2015),820--865。谷歌学者谷歌学者数字图书馆数字图书馆
  13. Quoc V.Le和Tomas Mikolov。2014.句子和文件的分布式表示。第31届国际机器学习会议论文集。第14卷。1188--1196.谷歌学者谷歌学者
  14. Yann LeCun、Yoshua Bengio和Geoffrey Hinton。2015年,深度学习。《自然》5217553(2015),436。谷歌学者谷歌学者
  15. 李昕、李东冰、魏林和贝施。2018.目标导向情绪分类的转型网络。Arxiv预印Arxiv:1805.01086(2018)。谷歌学者谷歌学者
  16. Jimmy J.Lin和W.John Wilbur。2007.PubMed相关文章:基于主题的内容相似性概率模型。BMC生物信息学8(2007),483。内政部:https://doi.org/10.1186/1471-2105-8-423谷歌学者谷歌学者交叉引用交叉引用
  17. 周汉林、冯敏伟、西塞罗·诺盖拉·多斯桑托斯、莫玉、炳湘、周伯文和约舒亚·本吉奥。2017.结构化自我关注句子嵌入。Arxiv预印Arxiv:1703.03130(2017)。谷歌学者谷歌学者
  18. 刘珂、彭胜文、吴俊秋、翟成祥、马美泽和朱山峰。2015.MeSHLabeler:通过整合各种证据提高大规模MeSH索引的准确性。生物信息学31,12(2015),339--347。内政部:https://doi.org/10.1093/bioinformatics/btv237谷歌学者谷歌学者交叉引用交叉引用
  19. 托马斯·米科洛夫(Tomas Mikolov)、伊利亚·萨茨克沃(Ilya Sutskever)、陈凯(Kai Chen)、格雷格·科拉多(Greg S.Corrado)和杰夫·迪恩(Jeff Dean)。2013.单词和短语的分布式表示及其组成。神经信息处理系统进展论文集。3111--3119.谷歌学者谷歌学者数字图书馆数字图书馆
  20. James G.Mork、Antonio Jimeno-Yepes和Alan R.Aronson。2013.NLM医学文本索引器系统,用于索引生物医学文献。在评估论坛(CLEF'13)会议和实验室的会后研讨会《第一届生物医学语义索引和问答研讨会论文集》中。阿克塞尔·西里尔·恩贡加·恩戈莫和乔治·帕柳拉斯(编辑),第1094卷。CEUR-WS.org.检索自http://ceur-ws.org/Vol-1094/ibiosq2013_submission_3.pdf。谷歌学者谷歌学者
  21. 彭胜文、尤荣辉、王洪宁、翟成祥、马美泽和朱山峰。2016。DeepMeSH:用于改进大规模MeSH索引的深度语义表示。生物信息学32,12(2016),70-79。内政部:https://doi.org/10.1093/bioinformatics/btw294谷歌学者谷歌学者交叉引用交叉引用
  22. Lei Tang、Suju Rajan和Vijay K.Narayanan。2009年。通过metalabeler进行大规模多标签分类。第18届万维网国际会议论文集。美国医学会,211-220。谷歌学者谷歌学者
  23. 乔治·萨萨罗尼斯(George Tsatsaronis)、乔治奥斯·巴利卡斯(Georgios Balikas)、马拉卡西奥提斯(Prodromos Malakasiotis)、伊奥尼斯·帕塔拉斯(Ioannis Partalas)、马蒂亚斯·兹孔克(Matthias Zschunke)、迈克尔·R·阿尔维斯(Michael R.Alvers)、德克·魏森博恩(Dirk Weissenborn)、安娜斯塔西娅·克里塔拉(Anastasia Krithara)、塞尔吉奥斯·佩蒂迪斯(Sergios Petridis)、迪米特里斯·多时,莉莉亚娜·巴里奥·阿尔弗斯(Liliana Barrio-Alvers)、迈克尔·施罗德(Michael Schroeder)、伊恩·安德洛索普洛斯(Ion Androutsopoulos)和乔治奥斯·帕利乌拉斯(Georgios Paliouras)。2015年,BIOASQ大型生物医学语义索引和问答比赛综述。BMC生物信息学16(2015),138。内政部:https://doi.org/10.1186/s12859-015-0564-6谷歌学者谷歌学者交叉引用交叉引用
  24. 阿什什·瓦斯瓦尼(Ashish Vaswani)、诺姆·沙泽尔(Noam Shazeer)、尼基·帕尔玛(Niki Parmar)、雅各布·乌斯科雷特(Jakob Uszkoreit)、利昂·琼斯(Llion Jones)、艾丹·戈麦斯(Aidan N.Gomez)、尤卡斯·凯泽(ukasz Kais。2017年。你所需要的就是关注。神经信息处理系统进展论文集。5998--6008.谷歌学者谷歌学者
  25. 光绪勋(Guangxu Xun)、基什莱·贾(Kishlay Jha)、维什拉瓦斯·戈帕拉克里什南(Vishrawas Gopalakrishnan)、李亚良(Yaliang Li)和张爱东(Aidong Zhang)。2017.基于进化医学概念生成医学假设。2017年IEEE数据挖掘国际会议(ICDM’17)论文集。IEEE,535--544。谷歌学者谷歌学者交叉引用交叉引用
  26. 光绪勋、基什莱·贾、叶远、王亚庆和张爱东。2019.MeSHProbeNet:用于MeSH索引的自关注探测网。生物信息学35,19(2019年3月),3794-3802。内政部:https://doi.org/10.1093/bitinformatics/btz142谷歌学者谷歌学者
  27. 荀光旭、李亚良、高静、张爱东。2017.通过协调全球和本地上下文,合作改进主题发现和单词嵌入。第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集。美国医学会,535--543。谷歌学者谷歌学者数字图书馆数字图书馆
  28. 荀光旭、李亚良、赵欣、高静、张爱东。2017.使用单词嵌入的相关主题模型。第26届国际人工智能联合会议论文集。谷歌学者谷歌学者交叉引用交叉引用
  29. 叶远、荀光旭、所秋玲、贾可斌、张爱东。2017.Wave2vec:学习生物信号的深度表示。2017年IEEE数据挖掘国际会议(ICDM’17)论文集。IEEE,1159--1164。谷歌学者谷歌学者交叉引用交叉引用
  30. 郑乐成、于成和何景瑞。2019.多任务多视角学习的深度多模态模型。2019年SIAM国际数据挖掘会议记录。暹罗,10-18岁。谷歌学者谷歌学者交叉引用交叉引用
  31. 姚周和何景瑞。2017年。多视角下的随机众包方法。2017年IEEE数据挖掘国际会议(ICDM’17)论文集。IEEE,685--694。谷歌学者谷歌学者交叉引用交叉引用
  32. 朱珊凤、贾曾和马美泽。2009.通过合并MeSH语义相似度增强MEDLINE文档聚类。生物信息学25,15(2009),1944-1951。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. MeSHProbeNet-P:使用个性化MeSH探针改进大规模MeSH索引

        建议

        评论

        登录选项

        检查您是否可以通过登录凭据或您的机构访问本文。

        登录

        完全访问权限

        • 发布于

          从数据中发现知识的封面图像ACM事务
          ACM数据知识发现事务 第15卷第1期
          2021年2月
          361页
          国际标准编号:1556-4681
          EISSN公司:1556-472倍
          内政部:10.1145/3441647
          问题目录

          版权所有©2020 ACM

          如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

          出版商

          计算机协会

          美国纽约州纽约市

          出版历史

          • 出版:2020年12月7日
          • 认可的:2020年8月1日
          • 修订过的:2020年7月1日
          • 收到:2020年3月1日
          发布于tkdd公司第15卷第1期

          权限

          请求有关此文章的权限。

          请求权限

          检查更新

          限定符

          • 研究论文
          • 研究
          • 推荐

        PDF格式

        以PDF文件查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器

        HTML格式

        以HTML格式查看本文。

        查看HTML格式