×

用于微阵列数据分析的正交联合稀疏NMF。 (英语) 兹比尔1418.92039

摘要:3D微阵列,通常称为基因样本时间微阵列,将2D微阵列收集的不同时间点的信息耦合起来,用于测量不同样本之间的基因表达水平。他们的分析在一些生物医学应用中很有用,比如在药物基因组学研究中监测患者随时间变化的剂量或药物治疗反应。许多统计和数据分析工具被用来提取有用的信息。特别是,非负矩阵因式分解(NMF)凭借其自然非负性约束,已证明其能够从2D微阵列中提取特定生物过程中涉及的特定基因的相关信息。在本文中,我们提出了一种新的NMF模型,即正交联合稀疏NMF,通过添加额外的约束来加强对进一步生物分析有用的重要生物学特性,从而从包含2D微阵列时间演化的3D微阵列中提取相关信息。我们开发了单调减少目标函数的乘法更新规则,并在合成数据集和实际数据集上将我们的方法与最新的NMF算法进行了比较。

MSC公司:

92C40型 生物化学、分子生物学
15A23型 矩阵的因式分解
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Alter O,Brown PO,Botstein D(2000)基因组表达数据处理和建模的奇异值分解。国家科学院院刊97(18):10101-10106
[2] Baranzini SE、Mousavi P、Rio J、Caillier SJ、Stillman A、Villoslada P、Wyatt MM、Comabella M、Greller LD、Somogyi R等人(2004)使用监督计算方法对IFN\[\beta\]β反应的基于转录的预测。普洛斯生物3(1):e2
[3] Boccarelli A、Esposito F、Coluccia M、Frassanito MA、Vacca A、Del Buono N(2018)通过基因表达谱的非负矩阵分解方法自动提取基因,提高对mgus和mm疾病骨髓成纤维细胞活化的认识。《运输医学杂志》16(1):217
[4] Boivin N,Baillargeon J,Doss PMIA,Roy AP,Rangachari M(2015)干扰素-[\beta\]β在缺乏抗原呈递细胞的情况下抑制小鼠th1细胞功能。PLOS ONE第10(4)页:第1-17页
[5] 博格沃特,KM;Vishwanathan,S。;Kriegel,HP,使用动力系统内核从时间序列基因表达谱预测类别,547-558(2006),新加坡
[6] Boutsidis C,Gallopoulos E(2008)基于SVD的初始化:非负矩阵分解的先行者。图案识别41(4):1350-1362·Zbl 1131.68084号
[7] Boven L、Montagne L、Nottet H、De Groot C(2000)巨噬细胞炎性蛋白-[1α\]α(MIP-[1α]-α)、MIP-[1beta\]β和RANTES mRNA半定量和蛋白在活动性脱髓鞘多发性硬化(MS)病变中的表达。临床实验免疫学122(2):257-263
[8] Brunet JP、Tamayo P、Golub TR、Mesirov JP(2004),使用矩阵分解发现元基因和分子模式。国家科学院院刊101(12):4164-4169
[9] Carmona-Saez P、Pascual-Marqui RD、Tirado F、Carazo JM、Pascual-Montano A(2006)通过非光滑非负矩阵分解对基因表达数据进行双聚类。BMC生物信息7(1):1
[10] Casalino G,Del Buono N,Mencar C(2014)《播种非负矩阵分解的减法聚类》。信息科学257:369-387·Zbl 1321.62067号
[11] Cheung VC、Devarajan K、Severini G、Turolla A和Bonato P(2015)通过具有时间约束系数的非负矩阵分解算法分解时间序列数据。2015年IEEE第37届医学和生物学会工程国际年会(EMBC),第3496-3499页
[12] Cichocki A,Zdunk R,Phan AH,Amari SI(2009)非负矩阵和张量因式分解:在探索性多路数据分析和盲源分离中的应用。纽约威利
[13] Crescenzi M,Giuliani A(2001)通过微阵列数据的主成分分析阐明肿瘤细胞系分类的主要生物学决定因素。FEBS快件507(1):114-118
[14] Dai JJ,Lieu L,Roke D(2006)用基因表达微阵列数据进行分类的降维。统计应用基因分子生物学5(1):1-21·Zbl 1166.62337号
[15] Buono,N。;埃斯波西托,F。;Fumarola,F。;博卡雷利,A。;Coluccia,M.,《乳腺癌微阵列数据:使用非负矩阵分解的模式发现》,281-292(2016),柏林
[16] Dhillon IS和Sra S(2005)具有Bregman发散的广义非负矩阵近似。NIPS第18卷
[17] Ding C、He X和Simon H(2005)关于非负矩阵分解和谱聚类的等价性。2005年SIAM国际数据挖掘会议论文集,第606-610页。暹罗
[18] Du-Mg、Zhang SW和Wang H(2009)基于多线性ICA的高阶基因表达谱肿瘤分类。高级生物信息。https://doi.org/10.1155/2009/926450
[19] Esposito F,Del Buono N(2017)探索稀疏NMF中的隐藏信息。巴里大学数学系技术报告8
[20] Farias RC、Cohen JE、Comon P(2016)《通过柔性耦合的联合分解探索多模数据融合》。IEEE传输信号处理64(18):4830-4844·Zbl 1414.94191号
[21] Gade Andavolu R,Comings DE,MacMurray J,Vuthoori RK,Tourtellotte WW,Nagra RM,Cone LA(2004)RANTES:多发性硬化症的遗传风险标志物。Mult Scler期刊10(5):536-539
[22] Gillis N(2012)通过数据预处理实现稀疏和唯一非负矩阵分解。J Mach学习研究13:3349-3386·Zbl 1436.15013号
[23] Gillis N,Glineur F(2012)非负矩阵分解的加速乘法更新和分层ALS算法。神经计算24(4):1085-1105
[24] Glaab E、Garibaldi JM、Krasnogor N(2011)大规模生物数据集的综合分析。《Nat Precidings》。https://doi.org/10.1038/npre.2011.5598.1
[25] He Z,Xie S,Zdunk R,Zhou G,Cichocki A(2011)对称非负矩阵分解:概率聚类的算法和应用。IEEE Trans Neural Netw 22(12):2117-2131
[26] Hoyer PO(2004)具有稀疏约束的非负矩阵分解。J Mach学习研究457-1469·Zbl 1222.68218号
[27] Huang YM,Hussien Y,Jin YP,Söderstrom M,Link H(2001)《多发性硬化:血单个核细胞对干扰素-β体外反应不足》。神经学报扫描104(5):249-256
[28] Hutchins LN,Murphy SM,Singh P,Graber JH(2008)使用非负矩阵因式分解的位置相关基序表征。生物信息学24:2684-2690
[29] Kim H,Park H(2007a)通过交替非负约束最小二乘法对微阵列数据进行稀疏非负矩阵分解。生物信息学23(12):1495-1502
[30] Kim H,Park H(2007b)通过交替非负约束最小二乘法对微阵列数据进行稀疏非负矩阵分解。生物信息学23(12):1495-1502
[31] Kim PM,Tidor B(2003)通过大规模基因表达数据的降维进行子系统识别。基因组研究13(7):1706-1718
[32] Kong W,Mou X,Hu X(2011)探索矩阵分解技术,用于阿尔茨海默病微阵列基因表达数据的重要基因识别。BioMed Cent BMC生物信息12:S7
[33] Kong W,Vanderburg CR,Gunshin H,Rogers JT,Huang X(2008)独立成分分析应用于微阵列基因表达数据的综述。生物技术45(5):501-520
[34] Kouskoumvekaki I,Shublaq N,Brunak S(2013)在翻译生物信息学时代促进大规模生物数据和工具的使用。生物信息简介15(6):942-952
[35] Lee DD和Seung HS(2000)非负矩阵分解算法。神经信息处理系统会议进展论文集,第3卷,第556-562页。麻省理工学院出版社
[36] Li Y和Ngom A(2010)基于非负矩阵和张量因子分解的临床微阵列基因表达数据分类。2010年IEEE生物信息学和生物医学国际会议(BIBM),第438-443页。电气与电子工程师协会
[37] Li Y和Ngom A(2011)通过张量分解方法对临床基因样本时间微阵列表达数据进行分类。收录:Rizzo R,Lisboa PJG(eds)《生物信息学和生物统计的计算智能方法》。柏林施普林格,第275-286页
[38] Li Z,Wu X,Peng H(2010)正交子空间上的非负矩阵分解。图案识别器Lett 31(9):905-911
[39] Liao JC、Boscolo R、Yang YL、Tran LM、Sabati C、Roychowdhury VP(2003)《网络成分分析:生物系统中调节信号的重建》。国家科学院院刊100(26):15522-15527
[40] Liu W,Yuan K,Ye D(2008)通过非负矩阵分解减少微阵列数据,以进行可视化和聚类分析。J生物识别信息41(4):602-606
[41] Liu W,Zheng N,and Lu X(2003)可视化编码中的非负矩阵分解。2003年IEEE声学、语音和信号处理国际会议论文集(ICASSP’03),第3卷,第3-293页。电气与电子工程师协会
[42] Mairal J、Bach F和Ponce J(2014)《图像和视觉处理的稀疏建模》。arXiv预打印arXiv:1411.3230·Zbl 1333.68263号
[43] Marckmann S、Wiesemann E、Hilse R、Trebst C、Stangel M、Windhagen A(2004)干扰素-[\beta\]β上调单核细胞上共刺激分子CD80、CD86和CD40的表达:对多发性硬化治疗的意义。临床实验免疫学138(3):499-506
[44] Moschetta M、Basile A、Ferrucci A、Frassanito MA、Rao L、Ria R、Solimando AG、Giuliani N、Angelina B、Fumarola F、Coluccia M、Rossini B、Ruggieri S、Nico B、Maiorano E、Ribatti D、Roccaro AM、Vacca A(2013)新型靶向性磷酸化-cMET克服了多发性骨髓瘤的耐药性并诱导其抗肿瘤活性。临床癌症研究19(16):4371-82
[45] Nikulin V和Huang TH(2012)通过基于梯度的矩阵分解和两个自适应学习率进行无监督降维。《ICML无监督和迁移学习研讨会论文集》,第181-194页
[46] Omberg L,Golub GH,Alter O(2007)张量高阶奇异值分解,用于不同研究的DNA微阵列数据的综合分析。《国家科学院院刊》104(47):18371-18376
[47] Pompili F,Gillis N,Absil PA,Glineur F(2014)正交非负矩阵分解的两种算法及其在聚类中的应用。神经计算141:15-25
[48] Rack MK,Yang Y,Lovett-Racke AE(2014)T-bet是否是多发性硬化症的潜在治疗靶点?干扰素细胞因子研究杂志34(8):623-632
[49] Takahashi N,Hibi R(2014)非负矩阵分解修正乘法更新的全局收敛性。计算优化应用57(2):417-440·兹比尔1305.65135
[50] Vandenbroeck K、Alloza I、Swaminathan B、Antigiüedad A、Otaegui D、Olascoga J、Barcina MG、De Las Heras V、BartoloméM、Fernández-Arquero M等人(2011)《IRF5作为多发性硬化风险基因的验证:干扰素β治疗和人类疱疹病毒-6感染中的假定作用》。免疫基因12(1):40
[51] Veganzones MA、Cohen JE、Farias RC、Chanussot J、Comon P(2016)高光谱数据的非负张量cp分解。IEEE Trans Geosci遥感54(5):2577-2588
[52] Wall ME、Rechtsteiner A和Rocha LM(2003),奇异值分解和主成分分析。收录:Berrar DP,Dubitzky W,Granzow M(eds)微阵列数据分析的实用方法。柏林施普林格,第91-109页
[53] Wiesemann E、Deb M、Trebst C、Hemmer B、Stangel M、Windhagen A(2008)干扰素-[\beta\]β对共信号分子的影响:多发性硬化患者单核细胞CD40、CD86和PD-l2的上调与干扰素治疗的临床反应相关。多发性硬化症J 14(2):166-176
[54] Yang Z,Michailidis G(2015)一种非负矩阵分解方法,用于检测异质组学多模态数据中的模块。生物信息学32(1):1-8
[55] Zhang A(2006)基因表达微阵列数据的高级分析,第1卷。新加坡世界科学·Zbl 1115.92023号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。