×

iProLINK公司

swMATH ID: 1469
软件作者: 胡、张梓;曼尼、因德吉特;文森特·赫莫索;刘洪芳;吴凯西·H·。
描述: iProLINK:用于文献挖掘的集成蛋白质资源大规模分子序列数据和PubMed科学文献的指数级增长推动了生物文献挖掘和信息提取方面的积极研究,以促进基因组/蛋白质组注释并提高生物数据库的质量。基于文本挖掘方法的前景,但同时由于缺乏足够的训练和基准数据,蛋白质信息资源(PIR)开发了一种蛋白质文献挖掘资源-ProLINK(集成蛋白质文献信息和知识)。由于PIR专注于UniProt蛋白质序列数据库的管理,iProLINK的目标是提供可用于书目映射、注释提取、蛋白质命名实体识别和蛋白质本体开发领域的文本挖掘研究的管理数据源。书目映射和注释提取的数据源包括映射引文(PubMed ID到蛋白质条目和特征线映射)和注释标记的文献语料库。后者包括数百篇摘要和全文文章,这些文章带有实验验证的翻译后修饰(PTM)标签,并在PIR蛋白质序列数据库中进行了注释。实体识别和本体开发的数据源包括蛋白质名称词典、单词标记词典、带蛋白质名称标记的文献语料库以及标记指南,以及基于PIRSF蛋白质家族名称的蛋白质本体。iProLINK可通过以下网址免费访问:http://pir.georgetown.edu/iprolink,包含所有可下载文件的超文本链接
主页: http://pir.georgetown.edu/pirwww/about/doc/2004-CBAC-iProLINK.pdf
关键词: 公共医学;UniProt公司;文献挖掘;自然语言处理;翻译后修改;蛋白质注释
相关软件: PNAD-CSS公司;UniProt公司
引用于: 1文件

按年份列出的引文