语义学者的文学图形建构

@正在进行{Ammar2018ConstructionOT,title={语义学者中文学图形的构建},作者={Waleed Ammar、Dirk Groeneveld、Chandra Bhagavatula、Iz Beltagy、Miles Crawford、Doug Downey、Jason Dunkelberger、Ahmed Elgohary、Sergey Feldman、Vu A.Ha、Rodney Michael Kinney、Sebastian Kohlmeier、Kyle Lo、Tyler C.Murray、Hsu-Han Ooi、Matthew E.Peters和Joanna L。Power、Sam Skjonsberg、Lucy Lu Wang、Christopher Wilhelm、Zheng Yuan、Madeleine van Zuylen和Oren Etzioni,booktitle={计算语言学协会北美分会},年份={2018年},url={https://api.semanticscholar.org/CorpusID:19170988}}
本文将文献图构建简化为常见的NLP任务,指出由于这些任务的标准公式不同而带来的研究挑战,并报告每个任务的实证结果。

本文图表

询问这篇论文
AI供电

开放式研究知识图中语义谓词的聚类

本文描述了裁剪两种基于AI的聚类算法的方法,用于推荐关于开放研究知识图(ORKG)中资源的谓词(在RDF语句中)并对谓词组提供了新的见解,这些谓词组自动松散地累积为通用语义模式,用于对44个研究机构的学术知识进行语义分析。

图形:查询语义学者的文学图形

本文描述了GrapAL的基本元素、如何使用它,并描述了几个用例,例如在给定主题上寻找专家进行同行评审、发现生物医学实体之间的间接联系以及计算基于引用的度量。

学术知识图完成的三重分类

这项工作介绍了exBERT,这是一种利用预训练变压器语言模型完成学术知识图的方法,并介绍了两个学术数据集,作为研究社区的资源,它们是从公共KG和在线资源中收集的。

从书籍到知识图表

提出了一种自下而上的方法,支持出版商在开放域中创建和维护自己的出版物知识图,方法是发布一条管道,该管道能够从AHSS出版物的书目和索引中提取结构化信息,消除歧义,规范化并将其导出为链接数据。

语义学者开放数据平台

本文将公共数据源和专有数据源结合起来,使用核心状态技术进行学术PDF内容提取和自动知识图构建,构建了语义学者学术图,这是目前最大的开放科学文献图。

面向知识图构建的开放式信息抽取

提出的OIE4KGC方法采用一个文档语料库并识别该语料库中的三元组,然后对其进行处理以生成文献知识图。

科学文献中结构化信息的可扩展、半监督提取

通过从科学文章中提取“目的”、“方法”和“结果”的基本概念,并使用它们构建知识图,从大量可用的原始科学文献中提取相关结构化信息的一种新颖、可扩展、半监督方法。

NLP知识图的端到端构造

本文将SciNLP-KG框架应用于ACL文集中的30000篇NLP论文,构建了一个大规模的KG,它可以帮助自动构建NLP社区的科学排行榜,并表明生成的KG包含高质量的信息。

图形:连接科学文献中的点

本文描述了GrapAL的基本元素、如何使用它,并描述了几个用例,例如在给定主题上寻找专家进行同行评审、发现生物医学实体之间的间接联系以及计算基于引用的度量。

引文意图分类及其对构建引文图的支持证据提取

构建了一个细粒度的引文图,将引文意图及其支持证据标记在引文和被引论文之间,并提出了一个使用Transformer编码器对长论文进行编码的模型。
...

基于知识图嵌入的学术搜索显式语义排序

引入了显式语义排序,这是一种新的排序技术,它利用知识图嵌入来表示实体空间中的查询和文档,并根据它们与知识图嵌入的语义连接对它们进行排序。

Swanson链接重温:使用概念影响图加速跨领域基于文献的发现

事实证明,这种深度阅读和搜索系统减少了发现“未发现的公共知识”所需的工作量,并且在该工具的帮助下,领域专家能够将建模时间从几个月大幅缩短到两天。

表EL:Web表中的实体链接

TabEL与之前的工作不同之处在于,它削弱了表的语义可以映射到目标知识库中预定义的类型和关系的假设,并以图形模型的形式强制执行软约束,为维基百科文档和表中往往同时出现的实体集分配更高的可能性。

基于内容的引文推荐

经验表明,尽管添加元数据可以提高标准度量的性能,但它支持在引文推荐设置中不太有用的自引,并基于此方法发布了一个用于引文推荐的在线门户。

TAGME:简短文本片段的即时注释(由维基百科实体提供)

我们设计并实现了TAGME,这是一个能够高效、明智地使用指向维基百科页面的相关超链接来扩充纯文本的系统。TAGME相对于已知的

实体链接的设计挑战

这项工作分析了EL问题的几个版本之间的差异,提出了一个简单但有效的模块化无监督系统,称为Vinculum,用于实体链接,并阐明了该系统的关键方面,包括提及提取、候选生成、实体类型预测、实体共指和连贯性。

识别有意义的引文

这项工作介绍了识别学术文献中重要引文的新任务,即指出被引用作品在新工作中被使用或扩展的引文,并提出了一种有监督的分类方法,该方法通过一系列特征来解决这项任务。

CiteSeerX:数字图书馆搜索引擎中的人工智能

这项工作介绍了CiteSeerX以下组件中使用的关键AI技术:文档分类和重复数据消除、文档和引文聚类、自动元数据提取和索引以及作者消歧。

2017年夏季评估任务10:科学IE-从科学出版物中提取关键词和关系

我们描述了SemEval从科学文档中提取关键短语及其之间的关系的任务,这对于理解哪些出版物描述了哪些过程、任务和

利用MEDLINE中的MeSH索引生成词义消歧数据集

提出了一种使用统一医学语言系统(UMLS)元词库和MEDLINE的手动MeSH索引自动开发WSD测试集的方法,并允许评估生物医学领域中的WSD算法。