跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
2019年4月16日;91(8):5191-5199.
doi:10.1021/acs.analchem.8b05821。 Epub 2019年4月1日。

使用深度神经网络预测离子迁移碰撞截面:DeepCCS

附属机构

使用深度神经网络预测离子迁移碰撞截面:DeepCCS

Pier-Luc Plante码头等。 Ana Chem公司

摘要

使用质谱的非靶向代谢组学测量是发现具有环境和生物重要性的新小分子的有力工具。然而,由于碎片化困难或不特定的碎片离子信息,小分子识别步骤仍然是一个巨大的挑战。目前解决这一挑战的方法通常依赖于数据库,或需要使用核磁共振(NMR),这有其自身的困难。最近证明,使用离子迁移谱(IMS)测量获得的气相碰撞截面(CCS)值可以减少假阳性代谢物鉴定的数量。虽然前景看好,但目前可用的CCS经验信息数量有限,因此需要开发预测CCS方法。在本文中,我们通过使用深度学习算法预测CCS值来扩展当前的实验IMS能力。我们成功地开发并训练了CCS值的预测模型,该模型只需要有关化合物的SMILES符号和离子类型的信息。使用来自五个不同实验室、使用不同仪器的数据,可以对2400多个分子进行算法训练和测试。结果发现,对于广泛的分子,CCS预测的测定系数为0.97,相对误差中值为2.7%。此外,该方法只需要少量的处理能力即可预测CCS值。考虑到所需的性能、时间和资源,以及其对各种分子的适用性,该模型能够优于所有当前可用的CCS预测算法。

PubMed免责声明

利益冲突声明

笔记

作者声明没有竞争性的经济利益。

数字

图1。
图1。
DNN和经典机器学习在CCS预测中的比较。蓝色部分纯粹是计算性的,使得DNN几乎完全是计算性方法。经典机器学习需要输入定义明确、全面的分子描述符,这可能会受到领域知识的负面影响(例如,CCS与米/z值),降低其准确性。
图2。
图2。
卷积神经网络执行的不同操作的示意图。
图3。
图3。
在DeepCCS的训练、验证和测试集之间划分不同的源数据集。
图4。
图4。
DeepCCS神经网络结构。上面的蓝色部分执行一系列卷积和最大池步骤,以学习编码的SMILES输入的内部表示。该表示被扁平化,并与网络下部处理的离子类型串联在一起,以橙色表示,通过一系列密集层执行CCS预测。详细的网络结构见表S3。
图5。
图5。
比较测试集所有化合物的IMS测量值和预测CCS值。复合类来自Baker数据集,其他类未分类。实线(ref)表示完全拟合的参考线(斜率为1)。虚线表示与数据拟合的二阶多项式样条,以显示总体趋势。字母A–E分别表示异常值,如斩首酸甲酯、1,2-二酰基--甘油-3-磷酸胆碱,d日-麦芽糖、槐糖和-苏氨酸(请参阅支持信息)。
图6。
图6。
DeepCCS和MetCCS在五个不同测试集上的误差分布比较。以前检测到的数据库错误已从比较中删除。
图7。
图7。
使用ClassyFire分类法对DeepCCS数据集的分子进行超类级别的分类。“其他”组包含以下类别:有机卤素化合物、有机聚合物、有机硫化合物和均质非金属化合物。(A) 有机氧化合物。(B) 生物碱及其衍生物。(C) 苯丙类化合物和聚酮。表S6和S7中提供了子类和类级别的分类表。

类似文章

引用人

  • 通过行波离子迁移率测量极低分子量代谢物及其在人类尿液样品中的应用。
    Kurilung A、Limjiasahapong S、Kaewnarin K、Wisanpitayakorn P、Jariyasopit N、Wanichthanarak K、Sartyoungkul S、Wong SCC、Sathirapongsasuti N、Kitiyakara C、Sirivatanauksorn Y、Khoomrung S。 Kurilung A等人。 《药物分析杂志》。2024年5月;14(5):100921. doi:10.1016/j.jpha.2023.12.011。Epub 2023年12月16日。 《药物分析杂志》。2024 PMID:38799238 免费PMC文章。
  • 利用离子极化率和分子质量在有限数据下精确预测离子迁移碰撞截面。
    Wisanpitayakorn P、Sartyoungkul S、Kurilung A、Sirivatanauksorn Y、Vissesangangan W、Sathirapongsasuti N、Khoomrung S。 Wisanpitayakorn P等人。 化学信息模型杂志。2024年3月11日;64(5):1533-1542. doi:10.1021/acs.jcim.3c01491。Epub 2024年2月23日。 化学信息模型杂志。2024 PMID:38393779 免费PMC文章。
  • 大气质谱中的数据驱动化合物识别。
    Sandström H、Rissanen m、Rousu J、Rinke P。 Sandström H等人。 高级科学(Weinh)。2024年2月;11(8):e2306235。doi:10.1002/advs.202306235。Epub 2023年12月14日。 高级科学(Weinh)。2024 PMID:38095508 免费PMC文章。
  • 用于加速农用化学品发现的化学信息学和人工智能。
    Djoumbou-Feunang Y、Wilmot J、Kinney J、Chanda P、Yu P、Sader A、Sharifi M、Smith S、Ou J、Hu J、Shipp E、Tomand D、Kumpatla SP。 Djoumbou-Feunang Y等人。 前部化学。2023年11月29日;11:1292027. doi:10.3389/fchem.2023.1292027。eCollection 2023年。 前部化学。2023 PMID:38093816 免费PMC文章。 审查。
  • 离子迁移光谱法及其衍生碰撞截面在环境有机微污染物分析中的应用。
    Song XC、Canellas E、Dreolin N、Goshawk J、Lv M、Qu G、Nerin C、Jiang G。 Song XC等人。 环境科学技术。2023年12月26日;57(51):21485-21502. doi:10.1021/acs.est.3c03686。Epub 2023年12月13日。 环境科学技术。2023 PMID:38091506 免费PMC文章。 审查。

工具书类

    1. Lynn K-S;程M-L;陈Y-R;Hsu C;陈A;Lih TM;Chang H-Y;黄C;小M-S;平移W-H;宋天佑;Hsu W-L分析。《化学》2015,87(4),2143–2151。-公共医学
    1. Nguyen DH;Nguyen CH;Mamitsuka H生物信息简报。2018, 2018, 066.-项目管理咨询公司-公共医学
    1. 布拉伊诺维奇一世;沈T;梅塔SS;T类;吉杰;皮帕罗M;Cacciola F;蒙代洛L;Fiehn O分析。化学2018,90(18),10758–10764。-公共医学
    1. 5月JC;McLean JA年度。修订分析。化学2016,9(1),387–409。-项目管理咨询公司-公共医学
    1. 萨姆纳LW;安伯格A;巴雷特D;Beale MH;乞丐R;Daykin CA;风机TW-M;Fiehn O;Goodacre R;格里芬JL;Hankemeier T;哈代N;哈恩利J;东日本;科普卡J;AN车道;林登JC;万豪酒店;Nicholls AW;Reily医学博士;Thaden JJ;Viant MR代谢组学2007,3(3),211-221。-项目管理咨询公司-公共医学

出版物类型

LinkOut-更多资源