分类学和本体论组织关于概念及其关系的复杂知识。目前,与生物学、药理学、地质学和许多其他科学学科相比,化学界仍然缺乏标准的分类学/本体论。此外,迄今为止提出的手动或半自动分类尝试证明成本高昂、容易出错或不够全面,无法对公开获得的数以千万计的化合物进行详细分类。
ClassyFire是一个基于web的应用程序,用于对化学实体(包括肽和核苷酸序列)进行基于规则的自动结构分类。此应用程序使用基于规则的分类方法,该方法依赖于名为ChemOnt的可理解、全面和可计算的化学分类法。
ChemOnt具有综合性、可计算性和人工策划性。它涵盖了4825个化学类别有机和无机化合物。通过从科学文献(例如:IUPAC)和可用数据库中提取通用术语来创建和扩展类集。灵活性分类法目前与各自的团队合作映射到ChEBI和LIPID MAPS本体。此外,ChemOnt已部分映射到MeSH同义词库。这方面的绘图工作正在进行。由于其结构的灵活性和简单性以及化学组学定义,ClassyFire旨在轻松发展,以覆盖越来越多新发现的天然和合成化学实体支架,促进生物化学研究。
ClassyFire自动为所有已知的化学化合物(包括小分子、肽和肽序列)提供分级化学分类,以及基于结构的文本描述。如果可用,它还提供来自一些外部数据库(如ChEBI和LIPID MAPS)的描述符。这个化学实体,序列,然后将其分类存储在可以通过RESTful应用程序轻松访问的数据库中。
ClassyFire已经对几个最流行和最全面的数据库进行了注释,包括药物数据库,HMDB公司,公共化学,ECMDB公司,基督教青年会,T3DB(T3DB),中国电子商务研究院,脂质图、和MoNA-北美MassBank等等。此外,ClassyFire和ChemOnt已在下文所述的许多化学信息学相关任务中得到应用。
ClassyFire可以通过web界面或ClassyFire API。