吴刚;徐伟;张颖;魏益民 GeneRank的预处理共轭梯度算法及其在微阵列数据挖掘中的应用。 (英语) Zbl 1260.68351号 数据最小知识。发现。 26,第1号,27-56(2013). 摘要:关键基因的识别问题在生物学和医学中具有根本重要性。GeneRank模型探索连接性数据,以在微阵列实验中产生基因优先顺序,该实验比仅基于表达水平的实验更不易受实验噪声引起的变化的影响。GeneRank算法相当于求解一个不对称的线性系统。然而,当所讨论的矩阵非常大时,GeneRank算法效率低下,甚至可能不可行。另一方面,在GeneRank模型中,邻接矩阵是对称的,而原始的GeneRank算法未能利用问题的对称结构。本文中,我们发现GeneRank问题可以改写为对称正定线性系统,并提出了一种预处理共轭梯度算法来求解它。数值实验支持了我们的理论结果,并表明了新算法的优越性。 引用于三文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 92D10型 遗传学和表观遗传学 关键词:基因网络;微阵列;GeneRank公司;预处理共轭梯度法;Krylov子空间方法 软件:GeneRank公司;竞争;Matlab公司;测试矩阵;JDQZ公司;JDQR公司 PDF格式BibTeX公司 XML格式引用 \textit{G.Wu}等人,Data Min.Knowl。发现。26、第1号、第27-56号(2013;Zbl 1260.68351) 全文: 内政部 参考文献: [1] Aerts S等人(2006)通过基因组数据融合进行基因优先排序。国家生物技术24:537–544·doi:10.1038/nbt1203 [2] Agarwal S,Sengupta S(2009)按与疾病的相关性对基因进行排名。程序LSS计算系统生物信息会议8:37–46 [3] Bai Z,Demmel J,Dongarra J,Ruhe A,van der Vorst H(2000)代数特征值问题求解模板:实用指南。费城SIAM·Zbl 0965.65058号 [4] Benzi M(2002)《大型线性系统的预处理技术:综述》。计算物理杂志182:418–477·Zbl 1015.65018号 ·doi:10.1006/jcph.2002.7176 [5] Cipra B(2000)《20世纪最好的算法:编辑列出了前十大算法》。SIAM新闻33(4) [6] Demmel JW(1997)应用数值线性代数。费城SIAM·Zbl 0879.65017号 [7] Franke L等人(2006)重建功能性人类基因网络,并应用于确定位置候选基因的优先级。美国人类遗传学杂志78:1011–1025·doi:10.1086/504300 [8] Freschi V(2007)使用随机行走排序算法从交互网络预测蛋白质功能。IEEE生物信息学和生物工程国际会议,第42-48页 [9] Golub GH,Van Loan CF(1996)《矩阵计算》,第3版。约翰·霍普金斯大学出版社,伦敦巴尔的摩·Zbl 0865.65009号 [10] Hai D,Lee W,Thuy H(2008)一种基于PageRanking的疾病特征基因鉴定方法。IEEE Int Conf Netw传感器控制6–8:1496–1499 [11] Hestenes M,Stiefel E(1952)线性系统的共轭梯度方法。《自然科学杂志》第49期:409–436页·Zbl 0048.09901号 ·doi:10.6028/jres.049.044 [12] Jia Z(1997)基于Arnoldi过程的大型非对称特征值问题的精细迭代算法。线性代数应用259:1–23·Zbl 0877.65018号 ·doi:10.1016/S0024-3795(96)00238-8 [13] Ma X,Lee H,Wang L,Sun F(2007)CGI:通过结合基因表达和蛋白质相互作用数据来确定基因优先级的新方法。生物信息学23(2):215–221·doi:10.1093/bioinformatics/btl569 [14] Morrison J,Breitling R,Higham D,Gilbert D(2005)GeneRank:使用搜索引擎分析微阵列实验。BMC生物信息6:233–246·doi:10.1186/1471-2105-6-233 [15] Page L,Brin S,Motwami R,Winograd T(1998)PageRank引文排名:给网络带来秩序,技术报告。斯坦福大学计算机科学系,帕洛阿尔托 [16] Saad Y(2003)《稀疏线性系统的迭代方法》,第2版。费城SIAM·Zbl 1031.65046号 [17] Sharan R、Ulitsky I、Shamir R(2007),基于网络的蛋白质功能预测。分子系统生物3:1–13 [18] Taylor A,Higham D(2008)CONTEST:MATLAB的可控测试矩阵工具箱。ACM Trans Math Softw 35,第26条 [19] MATHWORKS公司(2004)MATLAB 7。九月 [20] Wu G,Zhang Y,Wei Y(2010)用于微阵列数据挖掘分析的计算GeneRank的Krylov子空间算法。计算机生物学杂志17:631–646·doi:10.1089/cmb.2009.0004 [21] Wu G,Zhang Y,Wei Y(审查中)加速Arnoldi-type算法计算谷歌的PageRank [22] Xenarios I、Salwinski L、Duan X、Higney P、Kim S(2002)DIP,《相互作用蛋白质数据库:研究蛋白质相互作用细胞网络的研究工具》。核酸研究30:303–305·doi:10.1093/nar/30.1.303 [23] Yue B,Liang H,Bai F(2007)《理解GeneRank模型》。IEEE第一届国际会议生物信息生物工程6–8:248–251 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。