×

基因组数据的多维缩放。 (英语) 兹比尔1359.62478

Pardalos,Panos M.(编辑)等,《随机和确定性全局优化进展》。查姆:施普林格(ISBN 978-3-319-29973-0/hbk;978-3-3169-29975-4/电子书)。Springer Optimization and Its Applications施普林格优化及其应用107、129-139(2016)。
摘要:研究基因组数据的科学家面临着分析和理解不断增长的数据量的挑战。多维缩放(MDS)是指在低维空间中表示高维数据,以保持数据点之间的相似性。度量MDS算法的目标是嵌入与输入差异接近的点间距。大多数度量MDS方法的计算复杂度都超过了O(n^2),这限制了其在大型基因组数据中的应用。可以考虑非度量MDS的应用,其中只考虑输入差异的相对顺序嵌入点间距离。与度量MDS相比,非度量MDS方法的复杂性更低,尽管它没有保留真正的关系。然而,如果输入差异不可靠、难以测量或根本不可用,则非度量MDS是合适的算法。本文概述了度量和非度量MDS方法及其在基因组数据分析中的应用。
关于整个系列,请参见[Zbl 1359.90005号].

理学硕士:

62页第10页 统计学在生物学和医学中的应用;元分析
91C15号机组 社会和行为科学中的单维和多维尺度
92D10型 遗传学和表观遗传学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agarwal,S.,Wills,J.,Cayton,L.,Lanckriet,G.,Kriegman,D.J.,Belongie,S.:广义非度量多维标度。摘自:国际人工智能与统计会议,第11-18页(2007年)
[2] Arndt,D.、Xia,J.、Liu,Y.、Zhou,Y.、Guo,A.C.、Cruz,J.A.、Sinelnikov,I.、Budwill,K.、Nesbø,C.L.、Wishart,D.S.:Metagenassist:比较宏基因组学的综合网络服务器。核酸研究40,W88–W95(2012)·doi:10.1093/nar/gks497
[3] 贝卡文,C.,Tchitchek,N.,Mintsa-Eya,C.,Lesne,A.,Benecke,A.:使用奇异值分解提高高维数据分析中多维缩放的效率。生物信息学27(10),1413-1421(2011)·doi:10.1093/bioinformatics/btr143
[4] Borg,I.,Groenen,P.J.:现代多维尺度:理论与应用。斯普林格统计系列,第1卷。施普林格,纽约(2005年)·Zbl 1085.62079号
[5] Clarke,K.,Warwick,R.:《海洋群落的变化:统计分析和解释方法》。Primer-E有限公司,德文郡(2001)
[6] Cox,T.F.,Cox,M.A.:多维标度。Chapman和HallCRC关于统计和应用概率的专著,第88卷。查普曼和霍尔/CRC出版社,伦敦/Boca Raton(2000)·Zbl 1147.68460号
[7] Dzemyda,G.、Kurasova,O.、Zhi ilinskas,J.:多维数据可视化。方法和应用系列:Springer优化及其应用,第75卷,第122页。柏林施普林格出版社(2013)·Zbl 1337.68001号 ·doi:10.1007/978-1-4419-0236-8
[8] Floudas,C.A.,Pardalos,P.M.:优化百科全书,第1卷。施普林格科技与商业媒体,柏林(2008)
[9] Goll,J.、Rusch,D.B.、Tanenbaum,D.M.、Thiagarajan,M.、Li,K.、Methé,B.A.、Yooseph,S.:METAREP:JCVI宏基因组学报告——一种用于高性能比较宏基因组学的开源工具。生物信息学26(20),2631–2632(2010)·doi:10.1093/bioinformatics/btq455
[10] Gonzalez,A.,Knight,R.:推进数十亿微生物序列的分析算法和管道。货币。操作。生物技术。23 (1), 64–71 (2012) ·doi:10.1016/j.copbio.2011.11.028
[11] Heinrich,V.、Kamphans,T.、Stange,J.、Parkhomchuk,D.、Hecht,J.,Dickhaus,T.,Robinson,P.N.、Krawitz,P.M.:通过与大规模测序项目的数据进行比较来评估外显子组基因分型的准确性。《基因组医学》第5期,第1-11期(2013年)·doi:10.1186/gm473
[12] Hughes,A.,Ruan,Y.,Ekanayake,S.,Bae,S.H.,Dong,Q.,Rho,M.,Qiu,J.,Fox,G.:识别超大序列集中簇的内插多维标度技术。摘自:《2011年大湖区生物信息学会议记录》,第13卷,第S9页。伦敦生物医学中心有限公司(2012年)
[13] Kruskal,J.B.:通过优化非计量假设的拟合优度实现多维标度。《心理测量学》29(1),1-27(1964)·兹伯利0123.36803 ·doi:10.1007/BF02289565
[14] Malaspinas,A.S.、Tange,O.、Moreno-Mayar,J.V.、Rasmussen,M.、DeGiorgio,M.,Wang,Y.、Valdiosera,C.E.、Politis,G.、Willerslev,E.、Nielsen,R.:Bammds:使用多维标度(MDS)评估低深度全基因组数据祖先的工具。生物信息学30(20),2962–2964(2014)·doi:10.1093/bioinformatics/btu410
[15] 马克思:生物学:大数据的巨大挑战。《自然》498(7453)、255–260(2013)·doi:10.1038/498255a
[16] McCue,M.E.,Bannasch,D.L.,Petersen,J.L.,Gurr,J.,Bailey,E.,Binns,M.M.,Distl,O.,Guérin,G.,Hasegawa,T.,Hill,E.W.等人:家马和现存趾周动物的高密度SNP阵列:用于关联绘图、遗传多样性和系统发育研究。公共科学图书馆-遗传学。8(1),e1002451(2012)·doi:10.1371/journal.pgen.1002451
[17] Metzker,M.L.:测序技术——下一代。Nat.Rev.基因。11 (1), 31–46 (2010) ·doi:10.1038/nrg2626
[18] Morrison,A.、Ross,G.、Chalmers,M.:通过采样、弹簧和插值实现快速多维缩放。Inf.Vis.公司。2 (1), 68–77 (2003) ·doi:10.1057/palgrave.ivs.9500040
[19] Nekrutenko,A.,Taylor,J.:下一代测序数据解释:增强再现性和可访问性。Nat.Rev.基因。13 (9), 667–672 (2012) ·数字对象标识代码:10.1038/nrg3305
[20] Pardalos,P.M.、Shalloway,D.、Xue,G.等人:非凸能量函数的全局最小化:分子构象和蛋白质折叠。离散数学和理论计算机科学DIMACS系列,第23卷。美国数学学会,普罗维登斯,RI(1996)·Zbl 0831.00024号
[21] Park,S.、Shin,S.Y.、Hwang,K.B.:CFMDS:基于CUDA的基因组尺度数据快速多维缩放。BMC生物信息。13(补充17),1-23(2012)
[22] Park,J.、Brureau,A.、Kernan,K.、Starks,A.、Gulati,S.、Ogunnaike,B.、Schwaber,J.和Vadigepalli,R.:输入驱动细胞表型变异。基因组研究24(6),930–941(2014)·doi:10.1101/gr.161802.113
[23] Purcell,S.、Neale,B.、Todd-Brown,K.、Thomas,L.、Ferreira,M.A.、Bender,D.、Maller,J.、Sklar,P.、De Bakker,P.I.、Daly,M.J.等人:Plink:全基因组关联和基于人群的连锁分析的工具集。Am.J.Hum.遗传学。81 (3), 559–575 (2007) ·doi:10.1086/519795
[24] Ruan,Y.,Ekanayake,S.,Rho,M.,Tang,H.,Bae,S.H.,Qiu,J.,Fox,G.:DACIDR:使用大量16s rRNA序列的内插维数缩减的确定性退火聚类。摘自:ACM生物信息学、计算生物学和生物医学会议记录,BCB’12,第329-336页。ACM,纽约(2012)·doi:10.1145/2382936.2382978
[25] Ruan,Y.,House,G.L.,Ekanayake,S.,Schutte,U.,Bever,J.D.,Tang,H.,Fox,G.:将聚类和多维尺度结合起来,以确定以三维可视化的球形谱系图表示的系统发育树。2014年第14届IEEE/ACM集群、云和网格计算国际研讨会(CCGrid),第720-729页。IEEE,纽约(2014)·doi:10.1109/CCGrid.2014.126
[26] Schloss,P.D.、Westcott,S.L.、Ryabin,T.、Hall,J.R.、Hartmann,M.、Hollister,E.B.、Lesniewski,R.A.、Oakley,B.B.、Parks,D.H.、Robinson,C.J.等人:介绍方法:用于描述和比较微生物群落的开源、平台依赖、社区支持软件。申请。环境。微生物。75 (23), 7537–7541 (2009) ·doi:10.1128/AEM.01541-09
[27] Schloss,P.D.、Gevers,D.、Westcott,S.L.:减少pcr扩增和测序伪影对基于16s rRNA的研究的影响。《公共科学图书馆·综合》6(12),e27310(2011)
[28] Staley,C.、Unno,T.、Gould,T.J.、Jarvis,B.、Phillips,J.、Cotner,J.B.、Sadowsky,M.J.:应用Illumina新一代测序来表征密西西比河上游的细菌群落。J.应用。微生物。115 (5), 1147–1158 (2013) ·doi:10.1111/jam.12323
[29] Stanberry,L.、Higdon,R.、Haynes,W.、Kolker,N.、Broomall,W.,Ekanayake,S.、Hughes,A.、Ruan,Y.、Qiu,J.、Kolke,E.等人:可视化蛋白质序列宇宙。同意。计算。实际。专家。26 (6), 1313–1325 (2014) ·doi:10.1002/第3072页
[30] 田口,Y.h.,Oono,Y.:通过非度量多维尺度分析的基因表达关系模式。生物信息学21(6),730-740(2005)·doi:10.1093/bioinformatics/bti067
[31] 托格森,W.S.:多维标度:I.理论和方法。《心理测量学》17(4),401-419(1952)·Zbl 0049.37603号 ·doi:10.1007/BF02288916
[32] Tzeng,J.,Lu,H.H.,Li,W.H.:大型基因组数据集的多维标度。BMC生物信息。9 (1), 179 (2008) ·doi:10.1186/1471-2105-9-179
[33] Wolfe,P.J.:理解大数据。程序。国家。阿卡德。科学。110 (45), 18031–18032 (2013) ·Zbl 1292.62020年 ·doi:10.1073/pnas.1317797110
[34] Zhu,C.,Yu,J.:非度量多维标度校正了不同样本类型关联映射中的人口结构。遗传学182(3),875–888(2009)·doi:10.1534/genetics.108.098863
[35] ƀilinskas,A.,Jakaitiene,A.:二维标度的共轭梯度法。Commun公司。认知。专题论文。43 (3–4), 3–13 (2010)
[36] Ju ilinskas,A.,Ju ilins kas,J.:并行遗传算法:多维尺度性能评估。摘自:《第九届遗传与进化计算年会论文集》,GECCO’07,第1492-1501页。ACM,纽约(2007)·doi:10.1145/1276958.1277229
[37] 闭ilinskas,A.,问ilins kas,J.:多维标度中的两级最小化。J.全球。最佳方案。38 (4), 581–596 (2007) ·邮编1145.90060 ·数字对象标识代码:10.1007/s10898-006-9097-x
[38] Zhi ilinskas,A.,Zhilinskas,J.:基于优化的可视化。见:最优化百科全书,第2785–2791页。柏林施普林格出版社(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。