跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2009年7月;8(7):3737-45.
doi:10.1021/pr801109k。

基于鸟枪蛋白质组数据集的肽识别逾渗算法的改进

附属公司

鸟枪蛋白质组学数据集肽鉴定渗滤器算法的改进

玛丽娜·斯皮瓦克等。 蛋白组学研究杂志. 2009年7月.

摘要

Shotgun蛋白质组学结合数据库搜索软件可以在单个实验中识别大量肽。然而,一些现有的搜索算法,如SEQUEST,使用的评分函数主要用于识别给定光谱的最佳肽。因此,当比较跨光谱的鉴定时,SEQUEST评分函数Xcorr无法准确区分正确和不正确的肽鉴定。提出了几种机器学习方法来解决由此产生的区分正确和错误肽谱匹配(PSM)的分类任务。最近的一个例子是Percolator,它使用半监督学习和诱饵数据库搜索策略来学习区分由数据库搜索算法识别的正确和错误PSM。目前的工作描述了Percolator的三项改进。(1) Percolator的启发式优化被一个明确的目标函数取代,其选择背后有直观的原因。(2) 使用可牵引的非线性模型代替线性模型,从而提高了原始Percolator的精度。(3) 提出了一种Q秩法,用于在指定的Q值下直接优化已识别光谱的数目,从而获得进一步的增益。

PubMed免责声明

数字

图1
图1。损失函数的三种类型
每个面板将损失绘制为真实和预测标签差异的函数。平方损失L(左)((f)(x个),) = ((f)(x个) −)2通常用于回归问题,也用于分类[22]。铰链损失L(左)((f)(x个),)=最大值(0,1−伊夫(x个))作为支持向量机中零损失的凸近似[8]。乙状结肠丢失L(左)((f)(x个),) = 1/经验(1+(f)(x个))可能不太常用,但在例如[23,27]中进行了讨论。
图2
图2。损失函数的比较
每个面板绘制酵母(A)训练集和(B)测试集的可接受PSM数量,作为值阈值。每个系列对应于图1所示的三个损失函数中的一个,其中包括Percolator和SEQUEST系列用于比较。
图3
图3。“切割”铰链损失会产生一种称为斜坡损失
使铰链损失具有零梯度z(z)=(f)(x个) <对于某些选定值有效地生成了sigmoid函数的分段线性版本。
图4
图4。Percolator、直接分类和Q-ranker的比较
该图将接受的PSM数量绘制为酵母数据集的阈值。每个序列对应一个不同的排序算法,包括Percolator以及直接分类算法和Q-ranker的线性和非线性版本。非线性方法使用5个隐藏单元。
图5
图5。训练优化方法的比较(迭代与错误率)
Q-ranker优化从训练过程中获得的直接优化的最佳结果开始,并继续进行300次迭代。这些结果在训练集上。请注意,对于每个值选择,Q-ranker将训练误差提高到分类算法的最佳结果之上。
图6
图6。在四个数据集上比较肽营养素、Percolator和Q-ranker
每个面板将可接受的目标PSM的数量绘制为值。该系列对应于三种不同的算法,包括使用17个特征和37个特征的两种Q-ranker变体。

类似文章

  • 从鸟枪蛋白质组数据集半监督学习肽鉴定。
    Käll L、坎特伯雷JD、Weston J、Noble WS、MacCoss MJ。 Käll L等人。 自然方法。2007年11月;4(11):923-5. doi:10.1038/nmeth1113。Epub 2007年10月21日。 自然方法。2007 PMID:17952086
  • 使用改进的吉祥物渗透仪通过电子转移解离增强肽鉴定。
    Wright JC、Collins MO、Yu L、Käll L、Brosch M、Choudhary JS。 Wright JC等人。 分子细胞蛋白质组学。2012年8月;11(8):478-91. doi:10.1074/mcp。O111.014522。Epub 2012年4月6日。 分子细胞蛋白质组学。2012 PMID:22493177 免费PMC文章。
  • 一种用于肽鉴定的无脱核方法。
    Gonnelli G、Stock M、Verwaeren J、Maddelein D、De Baets B、Martens L、Degroeve S。 Gonnelli G等人。 蛋白质组研究杂志,2015年4月3日;14(4):1792-8. doi:10.1021/pr501164r。Epub 2015年3月6日。 蛋白质组研究杂志,2015年。 PMID:25714903
  • 基于肽的蛋白质组学数据生成和识别的当前算法解决方案。
    Hoopmann MR,Moritz RL。 Hoopmann MR等人。 Curr Opin生物技术。2013年2月;24(1):31-8. doi:10.1016/j.copbio.2012.10.013。Epub 2012年11月8日。 Curr Opin生物技术。2013 PMID:23142544 免费PMC文章。 审查。
  • 肽中的修饰位点定位。
    Chalkley RJ公司。 Chalkley RJ公司。 高级实验医学生物。2016;919:243-247. doi:10.1007/978-3-319-4148-5_13。 高级实验医学生物学。2016 PMID:27975222 审查。

引用人

工具书类

    1. Anderson DC,Li W,Payan DG,Noble WS。蛋白质组学中鸟枪肽测序评估的新算法:肽MS/MS光谱和螯合评分的支持向量机分类。蛋白质组研究杂志。2003;2(2):137–146.-公共医学
    1. Benjamini Y,Hochberg Y。控制错误发现率:一种实用且强大的多重测试方法。《皇家统计学会学报B》,1995年;57:289–300.
    1. Brosch M,Yu L,Hubbard T,Choudhary J.用吉祥物渗透剂准确、敏感地鉴定肽。2008年提交。-项目管理咨询公司-公共医学
    1. Choi H,Ghosh D,Nesvizhskii A.使用目标经济数据库搜索策略和灵活混合物建模对大规模蛋白质组学中的肽鉴定进行统计验证。蛋白质组研究杂志。2008;7(1):286–292.-公共医学
    1. Choi H,Nesvizhskii AI.基于质谱的蛋白质组学中肽鉴定的半监督模型验证。蛋白质组研究杂志。2008;7(1):254–265.-公共医学

出版物类型

LinkOut-更多资源