向下箭头

TERMite文本分析引擎

使用我们的命名实体识别(NER)和提取引擎在几秒钟内解锁科学文本的价值

你如何扫描数以百万计的出版物、专利、报告和任何其他文档类型,以获取你最需要的信息?

越来越多对创新过程至关重要的基础科学内容被锁定在电子文档中。

TERMite(TERM标识、标记和提取)是我们语义分析软件套件的核心,是超快速命名实体识别(NER)和提取引擎。

结合我们的手工VOCab,它可以识别和提取科学文本中的相关术语,将非结构化内容转换为丰富的机器可读数据。

信息专业人员

你是:一位生命科学专业人士的工作包括寻找文献、专利、拨款和内部文件中的关键事实。
我们提供:能够对数百万文档进行数据挖掘,以确定关键提及和关系。

企业搜索

你是:一家希望使其内部搜索门户更加准确的公司。
我们提供:增强现有搜索工具以更准确地查找关键生物实体的能力,让用户更快乐、更有效率!

解决方案提供商

你是:在生命科学中生成文本内容或提供包含此类文本的IT系统(ELN、项目管理工具、行业数据库等)的任何人
我们提供:有机会丰富您的搜索、导航内容,并显著增加您的消费者的价值。

作为一个软件即服务(SaaS)解决方案TERMite的部署从未如此简单。用户可以通过无缝的产品升级以及扩展的基础架构支持从最新功能中获益。您可以自由地在用户界面中运行一次性分析,或者将TERMite嵌入到您的分析工作流程中,以充分发挥其潜力。有关更多详细信息,请查看我们的SaaS常见问题解答.

TERMite的最新功能

最新的TERMite 6.4版本有许多功能和更新,旨在使您的研究更智能、更快。最新功能包括:

  • 访问多达23个NER机器学习模型
  • 捆绑编辑器–创建和管理您的高级T快递模式搜索查询
  • TERMite公司-CENtree公司一键点击–在CENtree中编辑公共可用的本体,并将其轻松上传至TERMite
  • 新安全管理器–分配和使用角色来控制对TERMite域的访问
  • Vocab热重新加载–设置TERMite服务器以扫描最新更新
  • 增强的服务器监视工具
  • 作为同义词的正则表达式
  • Java API中的并行化
  • 改进的python支持
  • 并行服务器备份模式
  • 增强的脚本支持

与团队联系以了解更多信息或下载TERMite数据表.

下载TERMite数据表

VOCab–预制专家本体


计算方法有助于筛选和识别来自多个来源的相关材料,但难以处理科学文献的模糊性。可以使用多个术语来描述同一主题,这使得任何关键字搜索都很困难。

我们的高质量词汇表和本体提供了关键基础,使SciBite的TERMite引擎能够准确检测生物医学文本中的重要主题。

通过我们的内部实践和经验丰富的实践,每个词汇表都得到了增强本体论者和生物化学家和我们专有的本体丰富软件。

我们的VOCab涵盖的主题比任何公开的本体论(如MeSH、Uniprot和MeDDRA)都要深入得多。

如果不使用SciBite VOCab,就无法捕获用户需要的信息。

与团队联系以了解更多信息或下载VOCab数据表.

下载VOCab数据表

主要产品亮点

  • 快速图标/象形文字

    快速启动

    快速启动并运行,无需预索引或复杂设置

  • 坚固的图标/象形文字

    稳健

    企业级,可扩展到数十亿文档,能够在Hadoop等系统上运行大规模文档处理

  • 象形文字/图标-准确

    准确

    使用SciBite的VOCab精确标记和消除非结构化科学文本中的科学术语歧义,这些VOCab包含80多个生命科学主题中的2000多万个同义词,包括基因、药物、疾病、不良事件

  • 快速图标/象形图

    超高速

    在几分钟内处理数百万文档,如整个Medline数据库,或大量专利或内部文档

想了解更多关于TERMite的信息吗?

与我们联系,了解我们如何转换您的数据

联系我们

用例

文献中的生物标志物发现
[用例]

在基础和临床研究中,生物标记物的识别和应用几乎是制药组织任何生产流程中的一个强制性过程。经验证的生物标记物在预测临床结果中发挥着关键作用,并支持从候选发现到成功的临床治疗的转化。

生物医学文献中有大量有价值的生物标记物相关信息。然而,发现和验证新生物标记物的过程取决于从该资源中有效提取见解的能力。

SciBite使用语义丰富来释放非结构化文本的价值,并简化从科学文本中识别新的潜在生物标记线索。

阅读完整的用例

消除数据准备负担
[用例]

对于大多数制药公司来说,从异构和模糊的数据中提取见解仍然是一项挑战。数据驱动的研发时代正在推动对机器学习等技术的投资,以便对新药开发战略提供更深入的见解。

数据质量直接影响计算方法结果的准确性和可靠性。然而,实现干净、高质量的数据所需的工作成本可能很高,通常会令人望而却步,这就要求数据科学家将大部分时间花在“数据管理员”身上,而不是实际分析数据上。

SciBite提供了一个集成的、经济高效的解决方案,可以显著减少与数据清理、规范化和注释过程相关的时间和成本。输出确保下游集成和发现活动基于高质量的上下文数据。

阅读完整的用例

超越公平:释放生物测定数据的价值[用例]

专门用于管理生物测定数据的数据库包含丰富的研发知识,因此,为科学和操作问题的挖掘提供了丰富的资源。然而,由于数据的捕获和/或管理方式,大多数制药公司无法实现其数据的真正价值。

一项更广泛的科学界倡议导致确立了确保数据可查找、可访问、可互操作和可重用的原则。尽管最初关注的是公共领域数据的可访问性,但公平原则正迅速引起制药行业的兴趣。

SciBite独特的回顾性和前瞻性语义丰富的结合,立即为任何生物检测平台带来科学智能搜索,使其中的丰富信息得以有效地解锁和利用。

阅读完整的用例

转变大数据
[SciBite+Hadoop用例]

随着机器学习和大数据人工智能方法的兴起,能够集成到大型企业中常见的复杂生态系统中的系统变得越来越重要。

Hadoop系统可以容纳数十亿个数据对象,但由于缺乏描述性元数据,这些对象可能很难组织,这是一个常见的问题。SciBite可以通过解锁非结构化文本中的知识来支持下一代分析和洞察力,从而提高这一巨大资源的可发现性。

在这里,我们描述Hadoop和SciBite的结合如何为大型处理项目带来重大价值。

阅读完整的用例

企业搜索中的语义
[用例]

为了变得更加信息驱动,制药公司正转向企业搜索技术,以根据可获得的最相关信息做出更快、更明智的决策。企业搜索平台提供了可扩展的高性能基础架构,可以安全访问整个组织中数以百万计的文档,并从单个门户提供内容分析。

然而,用户通常只能搜索文档作者所写的内容。在数据输入期间,同义词的使用不一致,使得很难识别和整理与感兴趣主题相关的所有相关数据。

通过语义丰富,SciBite为企业搜索带来了科学理解,使其能够“理解”非结构化文本中的科学概念。这为获取药物发现情报和大量知识提供了前所未有的途径,并确保用户能够更好地了解信息,而不会让信息过载。

阅读完整的用例

相关文章

  1. 6.5.2 TERMite/VOCabs版本中的内容
     

    SciBite的词汇表为大量用例提供了燃料,从复杂的查询到数据集成和新知识的发现。在VOCabs的6.5.2版本中,SciBite将新的Emtree VOCab包以及新的序列本体词汇引入到Genotype-Phenotype词汇包中。还包括对现有词汇表的几个更新。  

    阅读
  2. SciBite启动Workbench–
    减少表格数据管理的工作量

    语义技术解决方案的领先提供商SciBite今天宣布推出Workbench,这是一种结构化数据注释工具,可以简化按照术语和本体标准管理数据的过程。

    阅读

SciBite语义平台如何帮助您?

与我们联系,了解我们如何转换您的数据

联系我们