×

计算生物学中的文本数据压缩:算法技术。 (英语) Zbl 1298.68087号

摘要:在最近的一次审查中[R.吉安卡洛等,“计算生物学中的文本数据压缩:概要”,生物信息学25,1575-1586(2009;doi:10.1093/bioinformatics/btp117)]本文首先系统地组织和介绍了文本数据压缩对生物数据分析的影响。它的主要重点是系统介绍生物信息学和计算生物学的关键领域,其中使用了压缩技术,并介绍了如何将信息理论中的著名概念应用于生物数据的成功处理。令人惊讶的是,数据压缩的使用在计算生物学中非常普遍。从这一点开始,这篇附带评论的重点是计算生物学中使用数据压缩所涉及的计算方法。事实上,尽管人们会预料到特别的压缩技术适应于生物数据,统一和同质的算法方法正在出现。此外,考虑到基于并行测序的实验是生物研究的未来,数据压缩技术是少数能够成功处理其产生的大量序列数据的候选技术之一;尽管到目前为止,只有在存储和索引方面,分析仍然是一个挑战。因此,这两篇互为补充的综述被认为是计算机科学家了解计算生物学带来的许多计算挑战的有用起点,在这些挑战中,信息科学的核心思想已经产生了重大影响。

MSC公司:

68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
第68页,共15页 数据库理论
68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
68问题30 算法信息理论(Kolmogorov复杂性等)
92D20型 蛋白质序列,DNA序列
68-02 与计算机科学有关的研究展览会(专著、调查文章)
92-08 生物问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Giancarlo,R。;Scaturro,D。;Utro,F.,《计算生物学中的文本数据压缩:概要》,生物信息学,251575-1586(2009)
[2] 欧·那尔班托格鲁。;罗素·D·J。;Sayood,K.,《数据压缩概念和算法及其在生物信息学中的应用》,熵,12,34-52(2010)
[3] Cohen,J.,《计算机科学家生物信息学导论》,ACM Computing Surveysl,36,2,122-158(2004)
[4] 勒鲁,M。;列斐伏尔,G。;Rougemont,J.,《处理和分析ChIP-seq数据:从短读到调控相互作用》,《功能基因组学简报》(2010年)
[5] 波普,M。;Salzberg,S.L.,新测序技术的生物信息学挑战,遗传学趋势,24142-149(2008)
[6] Flicek,P.,《速度的需要》,《基因组生物学》,2009年第10212页
[7] 纳瓦罗,G。;Mäkinen,V.,压缩全文索引,ACM计算调查,39,2(2007)
[8] Grümbach,S。;Tahi,F.,DNA序列的压缩,(IEEE数据压缩会议程序,IEEE数据编码会议程序,DCC(1993),IEEE计算机学会),340-350
[9] Grümbach,S。;Tahi,F.,压缩算法的新挑战:遗传序列,信息处理与管理,30875-886(1994)·Zbl 0813.92019号
[10] 盖,T.M。;Thomas,J.A.,《信息理论的要素》(1991年),《Wiley-Interscience:Wiley-Interscience纽约市》·Zbl 0762.94001号
[11] Rissanen,J。;Langdon,G.G.,《算术编码》,IBM研究与开发杂志,23149-162(1979)·Zbl 0404.94005号
[12] 对手,埃及。;Delahaye,J.P。;多切特,M。;Delgrange,O.,《重复DNA序列的保证压缩方案》,(IEEE数据压缩会议论文集。IEEE数据编码会议论文集,DCC(1996),IEEE计算机学会),453
[13] 陈,X。;Kwong,S。;Li,M.,DNA序列的压缩算法及其在基因组比较中的应用,(RECOMB 00:第四届国际计算分子生物学年会(2000),ACM:ACM纽约),107-117
[14] 陈,X。;李,M。;马,B。;Tromp,J.,《DNA压缩:快速有效的DNA序列压缩》,生物信息学,第18期,1696-1698页(2002年)
[15] Apostolico,A。;Lonardi,S.,贪婪离线文本替换的一些理论和实践,(IEEE数据压缩会议论文集。IEEE数据编码会议论文集,DCC(1998),IEEE计算机学会),119-128
[16] 松本,T。;Sadakane,K。;Imai,H.,生物序列压缩算法,基因组信息学,11,43-52(2000)
[17] Benci,V。;Bonanno,C。;加拉托洛,S。;Menconi,G。;Virgilio,M.,动力系统和可计算信息,离散和连续动力系统。B系列,4935-960(2004)·Zbl 1058.94512号
[18] Manzini,G。;Rastero,M.,《简单快速的DNA压缩器》,《软件实践与经验》,351397-1411(2005)
[19] S.Bao,S.Chen,Z.Jing,R.Ren,基于LUT和LZ77的DNA序列压缩算法,CoRR abs/cs/0504100;S.Bao,S.Chen,Z.Jing,R.Ren,一种基于LUT和LZ77的DNA序列压缩算法,CoRR abs/cs/0504100
[20] 贝扎迪,B。;Fessant,F.L.,《重新审视DNA压缩挑战:动态编程方法》(CPM(2005),Springer),190-200·Zbl 1130.68308号
[21] 塔布斯一世。;Korodi,G。;Rissanen,J.,使用离散回归的归一化最大似然模型进行DNA序列压缩,(IEEE数据压缩会议论文集。IEEE数据编码会议论文集,DCC(2003),IEEE计算机学会),253-262
[22] Hategan,A。;Tabus,I.,蛋白质是可压缩的,(第六届北欧信号处理研讨会论文集,第六届北欧信号处理会议论文集,NORSIG(2004),IEEE计算机学会),192-195年
[23] 科罗迪,G。;Tabus,I.,DNA序列压缩的高效归一化最大似然算法,ACM信息系统事务,23,3-34(2005)
[24] Tembe,W。;罗伊,J。;Suh,E.,G-SQZ:基因组序列和质量数据的紧凑编码,生物信息学(2010)
[25] 曹博士。;迪克斯,T.I。;Allison,L。;Mears,C.,《生物序列压缩的简单统计算法》,(IEEE数据压缩会议论文集。IEEE数据编码会议论文集,DCC(2007),IEEE计算机学会),43-52
[26] Adgeroh,D。;Nan,F.,关于蛋白质序列的可压缩性,(IEEE数据压缩会议论文集。IEEE数据编码会议论文集,DCC(2006),IEEE计算机学会),422-434
[27] 总督,D。;Zhang,Y。;穆克吉,A。;鲍威尔,M。;Bell,T.,《使用Burrows-Wheeler变换进行DNA序列压缩》,(IEEE计算机学会生物信息学会议(2002年),IEEE计算机协会),303-313
[28] Burrows,M。;Wheeler,D.,块分类无损数据压缩算法,数字设备公司(1994),技术报告124
[29] Gusfield,D.,《字符串、树和序列的算法:计算机科学和计算生物学》(1997),剑桥大学出版社:剑桥大学出版社·Zbl 0934.68103号
[30] Adgeroh,D。;Feng,J.,生物序列的SCP和压缩域分析,(IEEE计算机学会生物信息学会议论文集(2003),IEEE计算机协会),587
[31] Ziv,J。;Lempel,A.,通过可变速率编码压缩单个序列,IEEE信息理论汇刊,24530-536(1978)·Zbl 0392.94004号
[32] 基弗,J.C。;Yang,E.-H.,基于语法的代码:一类新的通用无损源代码,IEEE信息理论汇刊,46737-754(2000)·Zbl 1001.94019号
[33] 新泽西州拉尔森。;Moffat,A.,基于词典的离线压缩,(IEEE数据压缩会议议事录,IEEE数据编码会议议事录(1999),IEEE计算机学会),296-305
[34] Nevill-Manning,C.G。;Witten,I.H.,使用层次语法的压缩和解释,《计算机杂志》,40,103-116(1997)
[35] Cameron,R.D.,使用句法信息源模型的源编码,IEEE信息理论汇刊,34843-850(1988)
[36] 库克,C.M。;罗森菲尔德,A。;阿伦森,A.R.,《爬山语法推理》,《信息科学》,第10期,第59-80页(1976年)·Zbl 0331.68047号
[37] E.马什。;Sager,N.,《紧凑文本的分析和处理》,(第九届计算语言学大会论文集。第九届计算机语言学大会论文集中,COLING(1982),J.Horeck),201-206
[38] Stolcke,A。;Omohundro,S.M.,《通过贝叶斯模型合并归纳概率文法》,(第二届语法推理国际会议论文集,ICGI-94,第862卷(1994),Springer-Verlag),106-118
[39] N.Cherniavsky,R.Ladner,DNA序列的基于语法的压缩,收录于:Burrows-Wheeler变换DIMACS工作组,2004年。;N.Cherniavsky,R.Ladner,DNA序列的基于语法的压缩,收录于:Burrows-Wheeler变换DIMACS工作组,2004年。
[40] 刘,Q。;Yang,Y。;陈,C。;布,J。;Zhang,Y。;Ye,X.,RNACompress:RNA二级结构的基于语法的压缩和信息复杂性测量,BMC生物信息学,9,176+(2008)
[41] Higgs,P.G.,RNA二级结构:物理和计算方面,《生物物理季刊》,33,199-253(2000)
[42] Korodi,G。;Tabus,I.,注释核苷酸序列的压缩,IEEE/ACM计算生物学和生物信息学汇刊,447-457(2007)
[43] Storer,J.,《数据压缩:方法与理论》,《计算机科学原理丛书》(1988年),计算机科学出版社:计算机科学出版社,马里兰州罗克维尔
[44] Elias,P.,通用码字集和整数表示,IEEE信息理论汇刊,21194-203(1975)·Zbl 0298.94011号
[45] Golomb,S.W.,游程编码,IEEE信息理论汇刊,12399-401(1965)·Zbl 0141.14202号
[46] Huffman,D.A.,(最小冗余码的构造方法,最小冗余码构造方法,IRE,第40卷(1952年)),1098-1101·兹伯利0137.13605
[47] Tichy,W.F.,版本控制的RCSa系统,软件实践与经验,15637-654(1985)
[48] M.C.布兰登。;华莱士特区。;Baldi,P.,基因组序列数据的数据结构和压缩算法,生物信息学(2009)
[49] 每日,K。;Rigor,P。;克里斯特利,S。;谢,X。;Baldi,P.,高通量测序技术的数据结构和压缩算法,BMC生物信息学,11,514(2010)
[50] 克里斯特利,S。;卢,Y。;李,C。;Xie,X.,作为电子邮件附件的人类基因组,生物信息学,25274-275(2009)
[51] Buchsbaum,A.L。;Caldwell,D.F。;Church,K.W。;福勒,G.S。;Muthukrishnan,S.,《大规模表格压缩工程:一种实验方法》,(离散算法研讨会论文集。离散算法研讨会文献集,SODA 00(2000),ACM-SIAM),175-184·Zbl 0956.68508号
[52] Buchsbaum,A.L。;福勒,G.S。;Giancarlo,R.,用组合优化改进表压缩,ACM杂志,50825-851(2003)·Zbl 1325.68087号
[53] Vo、B.D。;Vo,K.-P.,使用列依赖性来压缩表格,(IEEE数据压缩会议程序,IEEE数据编码会议程序,DCC(2004),IEEE计算机学会),92-101
[54] Vo、B.D。;Vo,K.-P.,压缩具有列相关性的表数据,理论计算机科学,387,273-283(2007)·Zbl 1144.68025号
[55] Apostolico,A。;库尼亚尔,F。;Kaul,V.,通过记录交集进行表压缩,(IEEE数据压缩会议记录。IEEE数据压缩会议记录,DCC(2008),IEEE计算机协会),13-22
[56] 基因组,1000基因组计划。网址:http://www.1000genomes.org/; 基因组,1000基因组计划。网址:http://www.1000genomes.org/
[57] 怀特,W.T。;Hendy,M.,用线圈压缩DNA序列数据库,BMC生物信息学,9,242(2008)
[58] 施耐德,T.D。;斯托莫,G.D。;金,L。;Ehrenfeucht,A.,核苷酸序列上结合位点的信息含量,《分子生物学杂志》,188415-431(1986)
[59] 古特尔,R.R。;功率,A。;赫兹,G.Z。;普茨,E.J。;Stormo,G.D.,《识别RNA高阶结构的制约因素:比较序列分析方法的持续发展和应用》,核酸研究,205785-5795(1992)
[60] 李,M。;Vitányi,P.M.B.,《科尔莫戈洛夫复杂性及其应用导论》(1997),斯普林格-弗拉格:纽约斯普林格·Zbl 0866.68051号
[61] Bolshoy,A.,DNA序列分析语言工具:对比词汇、成分谱和语言复杂性,应用生物信息学,2103-112(2003)
[62] Konopka,A.K.,分子生物学和基因组学中的信息理论,《人类基因组自然百科全书》,3464-469(2005)
[63] 利奥,P。;Politi,A。;布亚蒂,M。;Ruffo,S.,DNA序列的高统计块熵测量,理论生物学杂志,180151-160(1996)
[64] 贝内代托,D。;卡利奥蒂,E。;Chica,C.,《压缩蛋白质组:中程相关性的相关性》,EURASIP生物信息学和系统生物学杂志,2007,1-8(2007)
[65] Loewenstern,D。;Yianilos,P.N.,《自然DNA序列的显著低熵估计》,《计算生物学杂志》,6125-142(1999)
[66] 施密特,A.O。;Herzel,H.,估算DNA序列的熵,理论生物学杂志,188369-377(1997)
[67] O.维斯。;Herzel,H.,蛋白质序列和属性代码的相关性,理论生物学杂志,190,341-353(1998)
[68] O.维斯。;Jiménez-Mataño,文学硕士。;Herzel,H.,蛋白质序列的信息含量,理论生物学杂志,206,379-386(2000)
[69] 法拉赫,M。;马里兰州诺德维尔。;萨瓦里,S.A。;Shepp,洛杉矶。;Wyner,A.D。;Ziv,J.,《DNA的熵:基于记忆和快速收敛的算法和测量》,(离散算法研讨会论文集。离散算法研讨会文献集,SODA 95(1995),ACM-SIAM),48-57·Zbl 0846.92009号
[70] Lempel,A。;Ziv,J.,《有限序列的复杂性》,IEEE信息理论汇刊,22,75-81(1976)·Zbl 0337.94013号
[71] Rodeh,M。;普拉特,V.R。;Even,S.,通过字符串匹配进行数据压缩的线性算法,ACM杂志,28,16-24(1981)·Zbl 0462.94015号
[72] Lanctot,J.K。;李,M。;Yang,E.,估算DNA序列熵,(离散算法研讨会论文集,离散算法研讨会文献集,SODA 00(2000),ACM-SIAM),409-418·Zbl 0963.92033号
[73] Gusfield,D.,后缀树(及其亲属)在生物信息学中成熟,(IEEE计算机学会生物信息学会议(2002年),IEEE计算机协会),3
[74] Apostolico,A.,《子词树的无数优点》,(单词组合算法。单词组合算法,北约ISI系列(1985),Springer-Verlag),85-96·Zbl 0572.68067号
[75] 费拉吉纳,P。;González,R。;纳瓦罗,G。;Venturini,R.,压缩文本索引:从理论到实践!,ACM实验算法杂志(2008)
[76] Sadakane,K.,压缩后缀数组的新文本索引功能,《算法杂志》,48,294-313(2003)·Zbl 1100.68563号
[77] 梅基宁,V。;纳瓦罗,G。;J.én爵士。;Välimäki,N.,《高度重复序列集合的存储和检索》,《计算生物学杂志》,第17期,第281-308页(2010年)
[78] Sadakane,K。;Shibyya,T.,为解决各种问题索引巨大的基因组序列,基因组信息学,12175-183(2001)
[79] 希利,J。;托马斯,E.E。;施瓦茨,J.T。;Wigler,M.,用精确的单词匹配注释大基因组,基因组研究,13,2306-2315(2003)
[80] 费拉吉纳,P。;Manzini,G.,机会主义数据结构及其应用,(第41届IEEE计算机科学基础研讨会论文集(2000),IEEE计算机学会),390-398
[81] Lippert,R.A。;莫巴里,C.M。;Walenz,B.P.,基因组数据的Burrows-Wheeler变换的空间有效构建,计算生物学杂志,12943-951(2005)
[82] Lippert,R.A.,利用Burrows-Wheeler变换进行空间效率全基因组比较,计算生物学杂志,12407-415(2005)
[83] 瓦利马基,N。;Gerlach,W。;迪克西特,K。;Mäkinen,V.,压缩后缀树——基因组规模序列分析的基础,生物信息学,23629-630(2007)
[84] 李,H。;Homer,N.,《下一代测序的序列比对算法调查》,《生物信息学简报》,第11473-483页(2010年)
[85] Langmead,B。;特拉内尔,C。;波普,M。;Salzberg,S.,《短DNA序列与人类基因组的超快和记忆效率比对》,《基因组生物学》,第10期,R25页(2009年)
[86] 李,H。;Durbin,R.,《使用Burrows-Wheeler变换进行快速准确的短读校准》,生物信息学,251754-1760(2009)
[87] Li,R。;Yu,C。;李毅。;Lam,T.-W。;Yiu,S.M。;K.克里斯蒂安森。;Wang,J.,SOAP2:一种改进的超快短阅读对齐工具,生物信息学,1966-1967年,25(2009)
[88] Strelets,V.B。;Lim,H.A.,蛋白质序列数据库的压缩,生物科学中的计算机应用(CABIOS),11557-561(1995)
[89] (Kruskal,J.B.;Sankoff,D.,《时间包裹、字符串编辑和大分子:序列比较的理论和实践》(1983),Addison-Wesley:Addison-Whesley Reading,马萨诸塞州)
[90] Waterman,M.S.,《计算生物学导论》。地图、序列和基因组(1995),查普曼和霍尔:查普曼&霍尔伦敦·Zbl 0831.92011号
[91] Vinga,S。;Almeida,J.S.,《无对齐序列比较:综述》,生物信息学,19513-523(2003)
[92] 布鲁德诺,M。;Do,C。;库珀,G。;Kim,M。;达维多夫,E。;计划,N.C.S。;格林,医学博士。;Sidow,A。;Batzoglou,S.,LAGAN和multi-LAGAN:基因组DNA大规模多重比对的有效工具,基因组研究,13721-731(2003)
[93] 李,M。;辛,C。;李,X。;马,B。;Vitányi,P.M.B.,《相似性度量》,IEEE信息理论汇刊,503250-3264(2003)·Zbl 1316.68052号
[94] 瓦雷,J.-S。;Delahaye,J.P。;对手,埃及。,转换距离:基于片段移动的相异性度量家族,生物信息学,15194-202(1999)
[95] Lemaitre,C。;Sagot,M.F.,《在非随机的基因组世界中的一次小小旅行——关于检测和分析重组断点的调查》,《理论计算机科学》,395171-192(2008)·Zbl 1142.92012年
[96] Apostolico,A.,基于子单词组成的最大单词顺序比较,(Elomaa,T.;Mannila,H.;Orponen,P.,《算法和应用》,《算法与应用》,计算机科学讲义,第6060卷(2010年),施普林格:施普林格-柏林,海德堡),34-44·Zbl 1284.68689号
[97] 埃皮法尼奥,C。;Giancarlo,R。;加布里埃尔,A。;Sciortino,M.,《生物数据挖掘的新型组合和信息理论无对齐距离》(Elloumi,M.;Zomaya,A.,《计算分子生物学中的算法:技术、方法和应用》(2010),John Wiley and Sons:John Willey and Sons New York),323-357
[98] 凯梅纳,C。;Notredame,C.,高通量时代多序列比对方法即将面临的挑战,生物信息学,2522455-2465(2009)
[99] Kertesz-Farkas,A。;Kocsor,A。;Pongor,S.,《基于数据压缩的距离在生物序列中的应用》(Emmert-Streib,F.;Dehmer,M.,《信息理论和统计学习》(2009),Springer),第83-100页·Zbl 1188.68131号
[100] 基奥,E。;Lonardi,S。;Rtanamahata,C.,《走向无参数数据挖掘》,(第十届ACM SIGKDD国际知识发现与数据挖掘会议(2004),ACM:ACM纽约),206-215
[101] 基奥,E。;基奥,L。;Handley,J.C.,基于压缩的数据挖掘(Wang,J.,《数据仓库和挖掘百科全书》(2008),IGI-Global:IGI-Global Hershley,PA),278-285
[102] Otu,H.H。;Sayood,K.,用于构建系统发育树的新序列距离度量,生物信息学,192122-2130(2003)
[103] Zhang,Y。;Hao,J。;周,C。;Chang,K.,归一化Lempel-Ziv复杂性及其在生物序列分析中的应用,数学化学杂志,461203-1212(2009)·Zbl 1197.92020号
[104] Bennett,C.H。;Gács,P。;李,M。;维坦伊,P.M.B。;Zurek,W.,《信息距离》,IEEE信息理论汇刊,441407-1423(1998)·Zbl 0964.94010号
[105] Cilibrasi,R。;Vitányi,P.M.B.,压缩聚类,IEEE信息理论汇刊,51,1523-1545(2005)·Zbl 1297.68097号
[106] 费拉吉纳,P。;Giancarlo,R。;格雷科,V。;Manzini,G。;Valiente,G.,《通过通用相似性度量对生物序列和结构进行基于压缩的分类:实验评估》,BMC生物信息学,8252(2007)
[107] Shkarin,D.,《PPM:实用性的一步》,(IEEE数据压缩会议纪要,IEEE数据编码会议纪要(2002),IEEE计算机学会),202-211
[108] Apostolico,A。;科明,M。;Parida,L.,可扩展基序的挖掘、压缩和分类,分子生物学算法,1,4(2006)
[109] 巴斯托拉,D.R。;Otu,H.H。;杜卡斯,S.E。;Sayood,K。;Hinrichs,S.H。;Iwen,P.C.,利用相对复杂性度量构建真菌系统发育树,《真菌研究》,108117-125(2004)
[110] 李,M。;Badger,J.H。;陈,X。;Kwong,S。;科尼,体育。;张浩,基于信息的序列距离及其在线粒体全基因组系统发育中的应用,生物信息学,17149-154(2001)
[111] 对手,埃及。;道切特,M。;Delahaye,J.P。;Delgrange,O.,压缩和遗传序列分析,《生物化学》,78,315-322(1996)
[112] 罗德里戈,A。;Bertels,F。;Heled,J。;诺德,R。;谢尔曼,H。;蔡,P.,《丰衣足食的危险:我们将如何处理所有这些基因?》?,(伦敦皇家学会哲学学报,B辑,生物科学(2008)),3893-3902
[113] 周,K。;Chuzhanova,N。;我·唐尼森。;Scott,I.,双子叶植物rbcS基因5'-非编码序列中保守区的进化层次,BMC进化生物学,7,51(2007)
[114] 惠勒,D.L。;巴雷特,T。;Benson,D.A。;Bryant,S.H。;卡纳斯,K。;切特弗宁,V。;Church,D.M。;医学博士库乔。;埃德加·R。;Federhen,S。;Geer,L.Y。;西赫尔姆伯格。;卡普斯丁,Y。;肯顿,D.L。;Khovayko,O。;Lipman,D.J。;Madden,T.L。;马格洛特,D.R。;奥斯特尔,J。;普鲁特,K.D。;舒勒,G.D。;Schriml,L.M。;Sequeira,E。;Sherry,S.T。;Sirotkin,K。;Souvorov,A。;Starchenko,G。;T.O.苏泽克。;塔图索夫,R。;Tatusova,T.A。;瓦格纳,L。;Yaschenko,E.,国家生物技术信息中心数据库资源,核酸研究,28,10-14(2000)
[115] Albayrak,A。;Otu,H。;Sezerman,U.,《使用相对复杂度测量和减少的氨基酸字母将蛋白质家族聚类为功能亚型》,BMC生物信息学,11428(2010)
[116] 吉尔伯特,D。;罗塞洛,F。;瓦伦特,G。;Veeramalai,M.,《TOPS字符串的无对齐比较》,(伦敦算法与弦论学报(2007),大学出版社),177-197年
[117] Kocsor,A。;Kartesz-Farkas,A。;Kajan,L。;Pongor,S.,基于压缩的距离测量在蛋白质序列分类中的应用:一项方法学研究,生物信息学,22407-412(2005)
[118] 北卡罗来纳州克拉斯诺戈尔。;Pelta,D.A.,《利用通用相似性度量法测量蛋白质结构的相似性》,生物信息学,第20期,第1015-1021页(2004年)
[119] 刘,N。;Wang,T.,利用氨基酸的亲水性特征进行基于蛋白质的系统发育分析,FEBS Letters,5805321-5327(2006)
[120] 刘,L。;Wang,T.,基于LZ复杂性的TOPS字符串比较,理论生物学杂志,25115-166(2008)·Zbl 1397.92534号
[121] 佩尔塔,D.A。;Gonzales,J.R。;Krasnogor,N.,《通过模糊接触图和通用相似性度量进行蛋白质结构比较》,(第四届EUSFLAT和第十一届LFA联合会议论文集,第四届欧盟SFLAT与第十一届LFA联合会议文献集,EUSFLAT-LFA 05(2005),加泰罗尼亚政治大学),1124-1129
[122] F.Rosselló、J.Rocha和J.Segura,基于通用相似性度量的压缩比仍然产生远离CATH距离的蛋白质距离。CoRR abs/q-bio/0603007;F.Rosselló、J.Rocha和J.Segura,基于通用相似性度量的压缩比仍然产生远离CATH距离的蛋白质距离。CoRR abs/q-bio/0603007
[123] 珀尔,F。;托德,A。;Sillitoe,I。;Dibley,M。;Redfern,O。;Lewis,T。;Bennett,C。;R.马斯登。;格兰特,A。;Lee,D。;Akpor,A。;麦鲍姆,M。;哈里森,A。;Dallman,T。;里夫斯,G。;迪邦,I。;阿杜,S。;Lise,S。;约翰斯顿,C。;Sillero,A。;桑顿,J。;Orengo,C.,CATH结构域数据库和相关资源Gene3D和DHS为基因组分析提供了全面的结构域家族信息,核酸研究,33,D247-D251(2005)
[124] Barthel,D。;赫斯特·J·D。;布拉·埃维茨(Blażewicz,J.)。;伯克,E.K。;Kransnogor,N.,ProCKSI:蛋白质(结构)比较、知识、相似性和信息的决策支持系统,BMC生物信息学,8416(2008)
[125] Otu,H.H。;Sayood,K.,《碎片组装的分而治之的方法》,生物信息学,19,22-29(2003)
[126] 加拉斯,D.J。;Nykter,M。;卡特,G.W。;价格,N.D。;Shmulevich,I.,生物信息作为基于集合的复杂性,IEEE信息理论汇刊,56667-677(2010)·Zbl 1366.92079号
[127] D.J.Galas、M.Nykter、G.W.Carter、N.D.Price、I.Shmulevich,《基于集合的复杂性和生物信息》。CoRR abs/0801.4024;D.J.Galas、M.Nykter、G.W.Carter、N.D.Price、I.Shmulevich,《基于集合的复杂性和生物信息》。二氧化碳回收率绝对值/0814.4024·Zbl 1366.92079号
[128] 杜宾,R。;肖恩·E·R。;Krogh,A。;Mitchison,G.,《生物序列分析:蛋白质和核酸的概率模型》(1999),剑桥大学出版社:剑桥大学出版社·Zbl 0929.92010号
[129] 史密斯,T。;Waterman,M.,《常见分子子序列的识别》,《分子生物学杂志》,147195-197(1981)
[130] Altshul,S.F。;Gish,W。;米勒,W。;Myers,E.W。;Lipman,D.J.,《基本局部比对搜索工具》,《分子生物学杂志》,215403-410(1990)
[131] Viterbi,A.J.,卷积码的误差界和渐近最优解码算法,IEEE信息理论汇刊,13260-269(1967)·Zbl 0148.40501号
[132] Buchsbaum,A.L。;Giancarlo,R.,语音识别中的算法方面:简介,ACM实验算法杂志,2,1(1997)
[133] 克罗西莫尔,M。;朗道,G。;Ziv-Ukelson,M.,无限制成本矩阵的亚二次序列比对算法,SIAM计算杂志,32,1654-1673(2003)·Zbl 1253.74047号
[134] Giancarlo,R.,《动态编程:特殊情况》,(模式匹配算法(1997)),201-236
[135] Mozes,S。;O.魏曼。;Ziv-Ukelson,M.,利用序列重复加速HMM解码和训练,(第18届组合模式匹配年度研讨会论文集,第18届联合模式匹配年度会议论文集,CPM(2007),Springer-Verlag),4-15·Zbl 1138.68420号
[136] 加布里埃尔,S。;沙夫纳,S。;Nguyen,H。;摩尔,J。;罗伊,J。;Blumenstiel,B。;希金斯,J。;DeFelice,M。;Lochner,A。;费加特,M。;Liu-Cordero,S.N。;Rotimi,C。;阿德耶莫,A。;库珀,R。;Ward,R。;兰德,E.S。;Daly,M.J。;Altshuler,D.,《人类基因组中单倍型块的结构》,《科学》,262225-2229(2002)
[137] 帕蒂尔,N。;Berno,A.J。;Hinds,D.A。;Barrett,W.A。;Doshi,J.M。;Hacker,C.R。;考策尔,C.R。;Lee,D.H。;马约里班克斯,C。;McDonough,D.P。;Nguyen,B.T。;诺里斯,M.C。;希恩,J.B。;沈,N。;斯特恩,D。;斯托科夫斯基,R.P。;托马斯·D·J。;特鲁森,M.O。;Vyas,K.R。;弗雷泽,K.A。;Fodor,S.P。;Cox,D.R.,《人类21号染色体高分辨率扫描揭示的有限单倍型多样性区块》,《科学》,2941719-1723(2001)
[138] 安德森,E.C。;Novembre,J.,使用最小描述长度原则寻找单倍型块边界,《美国人类遗传学杂志》,73,336-354(2003)
[139] Bockhorst,J。;Jojic,N.,通过最优分割发现生物序列中的模式,(第23届人工智能不确定性会议论文集(2007),AUAI出版社),17-24
[140] Daly,M.J。;Rioux,J.D。;沙夫纳,S.F。;哈德森·T·J。;Lander,E.S.,人类基因组中的高分辨率单倍型结构,《自然遗传学》,29,229-232(2001)
[141] Koivisto,M.,《发现单倍型块和估计单倍型区块边界强度的MDL方法》,(太平洋生物计算研讨会论文集,太平洋生物计算会议论文集,PSB(2003),世界科学出版社),502-513·Zbl 1256.92038号
[142] 张凯。;邓,M。;Chen,T。;Waterman,M.S。;Sun,F.,单倍型块分割的动态规划算法,美国国家科学院学报,7335-7339(2002)·兹比尔1029.92021
[143] Barron,A.R。;Rissanen,J。;Yu,B.,编码和建模中的最小描述长度原则,IEEE信息理论汇刊,442743-2760(1998)·Zbl 0933.94013号
[144] Grünwald,P.D.,《最小描述长度教程》
[145] 维坦伊,P.M.B。;Li,M.,最小描述长度归纳法,贝叶斯主义和科尔莫戈洛夫复杂性,IEEE信息理论汇刊,46446-464(2000)·Zbl 1013.68096号
[146] Parida,L.,《生物信息学理论与算法中的模式发现》(2007),查普曼与霍尔,CRC泰勒与弗朗西斯集团:查普曼和霍尔,CRC-泰勒与弗朗西丝集团纽约
[147] 雷内特,G。;施巴斯,S。;Waterman,M.,《单词统计与生物序列应用》(Lotaire,M.),《单词应用组合数学》,《数学百科全书及其应用》,第105卷(2005年),剑桥大学出版社,252-323·Zbl 1133.68067号
[148] 费雷拉,P.G。;Azevedo,P.J.,《评估蛋白质基序重要性度量:prosite模式的案例研究》,(计算智能和数据挖掘学报,计算智能和数字挖掘学报,CIDM(2007),IEEE计算机学会),34-43
[149] Milosavljevic,A。;Jurka,J.,通过算法重要性方法发现简单DNA序列,《生物科学中的计算机应用》,9407-411(1993)
[150] Milosavljevic,A.,《通过算法互信息发现依赖性:DNA序列比较的案例研究》,机器学习,21,35-50(1995)
[151] 鲍威尔,D.R。;Dowe,D.L。;Allison,L。;Dix,T.I.,通过压缩发现简单DNA序列,(太平洋生物计算研讨会论文集,太平洋生物计算会议论文集,PSB(1998),世界科学出版社),597-608
[152] Aktulga,H.M。;康托伊亚尼斯,I。;利兹尼克,洛杉矶。;斯潘科夫斯基,L。;格拉玛,A.Y。;Szpankowski,W.,《通过相互信息估计识别基因组序列中的统计依赖性》,《EURASIP生物信息学和系统生物学杂志》,2007,1-11(2007)
[153] Apostolico,A。;博克,M.E。;Lonardi,S.,《惊讶的单调性和对不寻常词汇的大规模探索》,《计算生物学杂志》,10283-311(2003)
[154] Brázma,A。;乔纳森,I。;尤科宁,E。;Vilo,J.,《发现生物序列中的模式和亚家族》,(第四届分子生物学智能系统国际会议论文集(1996),AAAI出版社),34-43
[155] 马庆秋,王建堂,用最小描述长度原则评价序列基序的重要性,2000。;马庆秋,王建堂,用最小描述长度原则评价序列基序的重要性,2000。
[156] Nevill-Manning,C.G。;Sethi,K.S。;Wu,T.D。;Brutlag,D.L.,《离散模体的枚举和排序》(第五届分子生物学智能系统国际会议论文集(1997),AAAI出版社),202-209年
[157] Chvátal,V.,《集合覆盖问题的贪婪启发式》,运筹学数学,4233-235(1979)·Zbl 0443.90066号
[158] Jonassen,I.,使用模式图高效发现保守模式,生物科学中的计算机应用,13509-522(1997)
[159] Apostolico,A。;科明,M。;Parida,L.,《Ziv-Lempel-Welch clef中的Motifs》,(IEEE数据压缩会议论文集。IEEE数据编码会议论文集,DCC(2004),IEEE计算机学会),72-81
[160] Apostolico,A。;科明,M。;Parida,L.,《通过模体模式发现桥接有损和无损压缩》,《信息传输和组合学的一般理论》,4123793-813(2006)·Zbl 1158.68389号
[161] 沙兰,R。;Ideker,T.,《通过生物网络比较建模细胞机械》,《自然生物技术》,24427-433(2006)
[162] 张,S。;张,X.-S。;Chen,L.,《生物分子网络查询:系统生物学中一种有前途的方法》,BMC系统生物学,2,5(2008)
[163] Margolin,A.A。;内曼,I。;Basso,K。;威金斯,C。;斯托洛维茨基,G。;Dalla Favera,R。;Califano,A.,ARACNEa:哺乳动物细胞环境中基因调控网络重建的算法,BMC生物信息学,7,Suppl.1,S7(2006)
[164] Butte,A.J。;Kohane,I.S.,《使用相关网络在医学数据库中进行非监督知识发现》,(AMIA研讨会论文集(1999),Hanley和Belfus),711-715
[165] Butte,A.J。;Kohane,I.S.,相互信息相关性网络:使用成对熵测量的功能基因组聚类,(太平洋生物计算研讨会论文集。太平洋生物计算研讨会论文集,PSB(2000),世界科学),415-426
[166] Butte,A.J。;Tamayo,P。;斯隆,D。;Golub,T.R。;Kohane,I.S.,使用相关网络发现RNA表达和化疗敏感性之间的功能关系,美国国家科学院学报,12182-12186(2000)
[167] A.Margolin,N.Banerjee,I.Nemenman,A.Califano,使用ARACNE算法对酵母转录网络进行反向工程,手稿。;A.Margolin,N.Banerjee,I.Nemenman,A.Califano,使用ARACNE算法对酵母转录网络进行逆向工程,手稿。
[168] 梅耶,体育。;Kontos,K。;拉菲特,F。;Bontempi,G.,大型转录调控网络的信息论推断,EURASIP生物信息学和系统生物学杂志,2007,8(2007)
[169] Chor,B。;Tuller,T.,《生物网络:通过相对描述长度进行比较、保护和进化》,《计算生物学杂志》,第14期,第817-834页(2007年)
[170] Kanehisa,M。;Goto,S.,KEGG:基因和基因组京都百科全书,核酸研究,28,27-30(2000)
[171] NCBI,NCBI分类数据库。网址:www.ncbi.nlm.nih.gov/enterz/linkout/tutorial/taxtour.html;NCBI,NCBI分类数据库。网址:www.ncbi.nlm.nih.gov/enterz/linkout/tutorial/taxtour.html
[172] Sculley,D。;Brodley,C.,DNA序列的压缩,(压缩和机器学习:特征空间向量的新视角。压缩和机器教学:特征空间矢量的新视角,DCC(2006),IEEE计算机学会),第332-332页
[173] 胡德·L。;Galas,D.,DNA的数字代码,《自然》,421,444-448(2003)
[174] 罗恩·D。;Singer,Y.,《健忘症的力量:学习可变记忆长度的概率自动机》(机器学习(1996),施普林格:施普林格荷兰),117-149·Zbl 0869.68066号
[175] Bejerano,G。;Yona,G.,概率后缀树的变异:蛋白质家族的统计建模和预测,生物信息学,17,23-43(2001)
[176] Apostolico,A。;Bejerano,G.,《最佳遗忘概率自动机或如何在线性时间和空间中学习和分类蛋白质》,(RECOMB'00:第四届国际计算分子生物学年会论文集(2000),ACM),25-32
[177] 舒尔茨,M.H。;韦斯,D。;Rausch,T。;Döring,A。;Reinert,K。;Vingron,M.,《快速和自适应变阶马尔可夫链构建》,(第八届生物信息学算法国际研讨会论文集。第八届国际生物信息学方法研讨会论文集,WABI’08(2008),Springer-Verlag),306-317
[178] Ziv,J.,《关于单个序列的有限内存通用数据压缩和分类》,IEEE信息理论汇刊,541626-1636(2008)·Zbl 1328.94044号
[179] Handl,J。;Knowles,J。;Kell,D.B.,后基因组数据分析中的计算聚类验证,生物信息学,21,15,3201-3212(2005)
[180] M.Nykter,O.Yli-Harja,I.Shmulevich,基因表达分析的归一化压缩距离,摘自:GENSIPS IEEE基因组信号处理与统计国际研讨会论文集,IEEE,2005年,第2-3页。;M.Nykter,O.Yli-Harja,I.Shmulevich,基因表达分析的归一化压缩距离,收录于:GENSIPS IEEE基因组信号处理与统计国际研讨会论文集,IEEE,2005年,第2-3页。
[181] 周,X。;王,X。;Dougherty,E。;Russ,D。;Suh,E.,基于集群互信息的基因聚类,计算生物学杂志,11,147-161(2004)
[182] Giancarlo,R。;Lo Bosco,G。;Pinello,L.,距离函数、聚类算法和微阵列数据分析(计算机科学讲义,第6073卷(2010))
[183] R.Giancarlo,G.Lo Bosco,L.Pinello,F.Utro,《后基因组时代聚类的三个步骤:概要》,摘自:Proc。CIBB,摘自:《计算机科学讲义》,2011年,第13-30页。;R.Giancarlo,G.Lo Bosco,L.Pinello,F.Utro,《后基因组时代聚类的三个步骤:概要》,摘自:Proc。CIBB,摘自:《计算机科学讲义》,2011年,第13-30页。
[184] 彭,H。;朗,F。;丁,C.,基于互信息的特征选择:最大依赖、最大相关和最小冗余标准,IEEE模式分析和机器智能汇刊,271226-1238(2005)
[185] 周,W。;周,C。;刘,G。;Zhu,H.,利用互信息和粗糙集理论进行微阵列数据分析的特征选择,(IFIP国际信息处理联合会,第204卷(2007),Springer:Springer-Boston),916-927
[186] Wang,H。;佩恩,C。;范,W.W。;Yu,P.,DNA微阵列数据中模式相似性搜索的索引结构,(IEEE计算机学会生物信息学会议论文集。IEEE计算机社会生物信息学大会论文集,CSB'02(2002),IEEE计算机协会),256
[187] 萨尔茨伯格,S。;塞尔·D·。;Kasif,S.,《分子生物学中的计算方法》(1998),Elsevier Science:Elsevie Science Amsterdam·Zbl 0898.00023号
[188] 西斯潘科夫斯基。;Ren,W。;Szpankowski,L.,基于MDL原则的最佳DNA分割,(IEEE计算机学会生物信息学会议(2003年),IEEE计算机协会,541-546
[189] Ziv,J.,《关于使用经验观测统计数据和通用数据压缩进行分类》,IEEE信息理论汇刊,34278-286(1988)·Zbl 0679.62049号
[190] 沙米尔,G.I。;科斯特洛,D.J。;Merhav,N.,分段静态无记忆信源的渐近最优低复杂度顺序无损编码,IEEE信息理论汇刊,46,2244-2467(2000)·Zbl 0997.94541号
[191] 门科尼,G。;Marangoni,R.,原核生物基因组中基于压缩的编码序列识别方法,计算生物学杂志,13,1477-1488(2006)
[192] Menconi,G.,DNA序列中信息的次线性增长,《数学生物学公报》,67737-759(2004)·Zbl 1334.92311号
[193] Madsen,B.E。;维尔森,P。;Wiuf,C.,《人类外显子中的短串联重复序列:疾病突变的靶点》,BMC基因组学,9410+(2008)
[194] 对手,埃及。;Delgrange,O。;Delahaye,J.P.(德拉海耶,J.P.)。;多切特,M。;Delorme,M.O。;Henaut,A。;Ollivier,E.,《通过压缩算法检测重要模式:DNA序列中近似串联重复的情况》,《生物科学中的计算机应用》,第13期,第131-136页(1997年)
[195] Allison,L。;Edgoose,T。;Dix,T.I.,带近似重复的字符串压缩,(《分子生物学中的智能系统学报》,分子生物学中智能系统学报,ISMB98(1998),AAAI出版社),8-16
[196] 迪克斯,T.I。;鲍威尔,D.R。;Allison,L。;伯纳尔,J。;Jaeger,S。;Stern,L.,《使用不同上下文通过每元素信息含量对长DNA序列进行比较分析》,BMC生物信息学,8,补遗2,S10(2007)
[197] Modegi,T.,DNA序列快速串联重复分析和无损压缩方法的发展,(基因组信息学研讨会论文集(2004),世界科学院出版社:东京世界科学院出版公司),P088
[198] 斯特恩,L。;Allison,L。;Dix,T.I.,《发现恶性疟原虫基因组DNA的模式》,分子与生物化学寄生虫学,118175-186(2001)
[199] Allison,L。;斯特恩,L。;Edgoose,T。;Dix,T.I.,生物序列分析的序列复杂性,计算机与化学,24,43-55(1992)
[200] 审查,《自然》审查关于microRNAs的收集,《自然评论》。doi:10.1038/nrg2202;审查,《自然》审查关于microRNAs的收集,《自然评论》。doi:10.1038/nrg2202
[201] 埃文斯,S.C。;Kourtidis,A。;Markham,T.S。;Miller,J。;康克林,D.S。;Torres,A.S.,使用MDLcompress检测和分析与乳腺癌相关的基因的微小RNA靶点,EURASIP生物信息学和系统生物学杂志,2007,1-16(2007)
[202] D.Loewenstern,H.Hirsh,P.N.Yianilos,M.Noordewier,使用基于压缩的诱导进行DNA序列分类,技术代表,DIMACS,1995年。;D.Loewenstern,H.Hirsh,P.N.Yianilos,M.Noordewier,使用基于压缩的诱导进行DNA序列分类,技术代表,DIMACS,1995年。
[203] J.Abel,数据压缩网站。http://www.data-compression.info/; J.Abel,数据压缩网站。http://www.data-compression.info/
[204] M.Mahoney,数据压缩程序。网址:http://www.cs.fit.edu/mmahoney/压缩/;M.Mahoney,数据压缩程序。网址:http://www.cs.fit.edu/mmahoney/压缩/
[205] G.Manzini,M.Rastero,DNA语料库。http://www.mfn.unipmn.it/manzini/dnacorpus/index.html;G.Manzini,M.Rastero,DNA语料库。http://www.mfn.unipmn.it/manzini/dnacorpus/index.html
[206] Nevill-Manning,G.C。;Witten,I.H.,《蛋白质是不可压缩的》,(IEEE数据压缩会议记录。IEEE数据压缩会议记录,DCC(1999),IEEE计算机学会),257-266
[207] M.D.Cao、T.I.Dix、L.Allison、C.Mears、XM软件。网址:http://www.csse.monash.edu.au/lloyd/tildeStrings/Compress/2007DCC/;M.D.Cao、T.I.Dix、L.Allison、C.Mears、XM软件。网址:http://www.csse.monash.edu.au/合金/tildeStrings/Compress/2007DCC/
[208] 生物信息学解决方案网站。http://www.bioinformaticssolutions.com/products/ph/; 生物信息学解决方案网站。http://www.bioinformaticssolutions.com/products/ph/
[209] G.Fowler,Pzip主页。http://www.research.att.com/gsf/man/man1/pzip.html;G.Fowler,Pzip主页。http://www.research.att.com/gsf/man/man1/pzip.html
[210] K.-P.Vo,Vcodex主页。http://www.research.att.com/gsf/download/ref/vcodex/vcodex.html;K.-P.Vo,Vcodex主页。http://www.research.att.com/gsf/download/ref/vcodex/vcodex.html
[211] M.C.Brandon,D.C.Wallace,P.Baldi,ProjectDNA压缩主页。http://www.mitomap.org/MITOWIKI/ProjectDNA压缩; M.C.Brandon,D.C.Wallace,P.Baldi,ProjectDNA压缩主页。http://www.mitomap.org/MITOWIKI/ProjectDNA压缩
[212] S.Christley,Y.Lu,C.Li,X.Xie,DNAzip主页。网址:http://www.ics.uci.edu/xhx/项目/DNAzip;S.Christley,Y.Lu,C.Li,X.Xie,DNAzip主页。网址:http://www.ics.uci.edu/xhx/项目/DNAzip
[213] 李,H。;手机,B。;Wysoker,A。;芬内尔,T。;阮,J。;北卡罗来纳州荷马。;马思·G。;阿贝卡西斯,G。;Durbin,R.,GPDP子组序列比对/地图格式和SAMtools,生物信息学,252078-2079(2009)
[214] W.Tembe,J.Lowey,E.Suh,G-SQZ主页。http://public.tgen.org/sqz; W.Tembe,J.Lowey,E.Suh,G-SQZ主页。http://public.tgen.org/sqz
[215] D.Loewenstern,P.N.Yianilos,CDNA主页。http://pnylab.com/pny/software/cdna/main.html; D.Loewenstern,P.N.Yianilos,CDNA主页。http://pnylab.com/pny/software/cdna/main.html
[216] R.A.Lippert、C.M.Mobarry、B.P.Walenz、Binary BWT。http://math.mit.edu/lippert/software/bbbwt/;R.A.Lippert、C.M.Mobarry、B.P.Walenz、Binary BWT。http://math.mit.edu/lippert/软件/bbbwt/
[217] N.Välimäki,W.Gerlach,K.Dixit,V.Mäkinen,SuDS基因组浏览器。http://www.cs.helsinki.fi/group/suds/cst/; N.Välimäki,W.Gerlach,K.Dixit,V.Mäkinen,SuDS基因组浏览器。http://www.cs.helsinki.fi/group/suds/cst/
[218] P.Ferragina、R.González、G.Navarro、R.Venturini、Pizza&Chili主页。http://pizzachili.dcc.uchile.cl/; P.Ferragina、R.González、G.Navarro、R.Venturini、Pizza&Chili主页。http://pizzachili.dcc.uchile.cl/
[219] P.Ferragina、R.Giancarlo、V.Greco、G.Manzini、G.Valiente、Kolmogorov图书馆主页。网址:http://www.math.unipa.it/拉斐尔/科尔莫戈罗夫/;P.Ferragina、R.Giancarlo、V.Greco、G.Manzini、G.Valiente、Kolmogorov图书馆主页。http://www.math.unipa.it网站/拉斐尔/科尔莫戈罗夫/
[220] R.Cilibrasi,A.L.Cruz,S.de Rooij,M.Keijzer,CompLearn主页。网址:http://www.complern.org/; R.Cilibrasi,A.L.Cruz,S.de Rooij,M.Keijzer,CompLearn主页。网址:http://www.complern.org/
[221] Gusev博士。;Nemytikova,A.L。;Chuzhanova,A.N.,关于基因序列的复杂性度量,生物信息学,1994-999(1999)
[222] J.-S.Varré,J.P.Delahaye,等。Rivals,The transformation distance主页。网址:http://www.lifl.fr/varre/TD/TD.html;J.-S.Varré,J.P.Delahaye,等。Rivals,The transformation distance主页。网址:http://www.lifl.fr/varre/TD/TD.html
[223] M.Crochemore,S.A.de Carvalho Jr.,Sourceforge网站。http://neobio.sourceforge.net/; M.Crochemore,S.A.de Carvalho Jr.,Sourceforge网站。http://neobio.sourceforge.net/
[224] Y.Lifshits,S.Mozes,O.Weimann,M.Ziv-Ukelson,《利用序列重复加速HMM解码和训练》。网址:http://www.cs.brown.edu/shay/hmmspeedup/hmmspeedip.html;Y.Lifshits,S.Mozes,O.Weimann,M.Ziv-Ukelson,《利用序列重复加速HMM解码和训练》。网址:http://www.cs.brown.edu/shay/hmmspeedup/hmmspeedup.html·Zbl 1191.68294号
[225] A.A.Margolin、K.Wang、W.K.Lim、M.Kustagi、I.Nemenman、A.Califano、ARACNE主页。http://amdec-bioinfo.cu-genome.org/html/ARACNE.htm; A.A.Margolin、K.Wang、W.K.Lim、M.Kustagi、I.Nemenman、A.Califano、ARACNE主页。http://amdec-bioinfo.cu-genome.org/html/ARACNE.htm
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。