生殖体

GENIA语料库-一个用于生物文本挖掘的语义标注语料库。动机:自然语言处理(NLP)方法被认为有助于提高生物文献中文本挖掘的潜力。然而,由于缺乏一个广泛注释的语料库,这是应用NLP技术的一个主要瓶颈。GENIA语料库正在开发中,为NLP技术用于生物文本挖掘提供参考资料。结果:由2000篇MEDLINE摘要组成的GENIA语料库3.0版已经发布,有400多个单词和近100 000个生物学术语注释。可用性:GENIA语料库可在http://www-tsujii.is.s.u-tokyo.ac.jp/GENIA免费获取


zbMATH参考文献(参考 11篇文章

显示结果1到11,共11个。
按年份排序(引用)

  1. Astrakhantsev,N.A.;Fedorenko,D.G.;Turdakov,D.Yu.:特定领域文本集合中自动术语识别的方法:一项调查(2015年)ioport公司
  2. 徐开权;廖少义;刘雷蒙Y.K.;赵利昂,J.:有效的主动学习策略在语义标注中使用大边距量词:最佳参数发现视角(2014)
  3. Goulart,Rodrigo Rafael Villarreal:生物医学文本中命名实体识别的系统综述(2011)ioport公司
  4. Segura Bedmar,Isabel;Crespo,Mario;De Pablo-Sánchez,César;Martínez,Paloma:用于提取药理学文档中药物相互作用的回指(2010年)ioport公司
  5. 张绍武;李,姚军;夏,李;潘,全:蛋白质相互作用的自动数据挖掘工具(2010)ioport公司
  6. Dimiller,Nazife;Varoílu,Ekrem;Altınçay,Hakan:生物医学命名实体识别的分类器子集选择(2009)ioport公司
  7. Kabiljo,Renata;Clegg,Andrew B.;Shepherd,Adrian J.:从自由文本中提取基因/蛋白质相互作用的方法的现实评估(2009)ioport公司
  8. 麦金托什,塔拉;库伦,詹姆斯R.:从全文文章中自动提取分子相互作用的挑战(2009)ioport公司
  9. 王,岳;金,金东;Sætre,符文;Pyysalo,Sampo;Tsujii,Jun-Ichi:研究跨语料库利用的异质蛋白质注释(2009)ioport公司
  10. Kim,Jin Dong;Ohta,Tomoko;Tsujii,Jun'ichi:从文献中挖掘生物医学事件的语料库注释(2008)ioport公司
  11. 杨志浩;林红飞;李彦鹏:基于词典的生物实体名称识别在生物医学文献中的应用(2008)