吉安卡洛·拉斐尔;西蒙娜·隆博(Simona E.Rombo)。;菲利波·乌特罗 DNA组合信息和表观基因组学:真核生物基因组中染色质组织和核小体占据的案例。 (英语) Zbl 1432.92062号 西奥。计算。科学。 792, 117-130 (2019). 摘要:表观基因组学是研究细胞遗传物质的修饰,这种修饰不依赖于DNA序列的变化,因为后者涉及DNA包裹的特定蛋白质。最终的结果是,表观基因组的变化对真核生物中每个细胞的正常工作具有根本作用。表观基因组学的一个特别重要的部分集中于染色质的研究,染色质是一种由DNA蛋白复合物组成的纤维,是真核生物的特征。了解染色质是如何组装和变化的,这是生物学的基础。在这一领域30多年的研究中,数学和理论计算机科学在建模和挖掘方面发挥了突出的作用,尤其是所谓的10nm光纤。从生物学的一些非常基本的概念出发,我们简要说明了通过实验室实验在染色质的组织和动力学方面取得的最新进展。然后,我们主要关注组合方法和信息方法对理解决定10nm光纤的机制的贡献,这些方法是理论计算机科学的核心。最后,我们强调了几个被认为重要的研究方向,以及理论计算机科学可以提供高影响力结果的方向。 MSC公司: 92D10型 遗传学和表观遗传学 92-08 生物问题的计算方法 关键词:计算生物学;算法和复杂性;形式语言;字的组合 软件:Web徽标;ClustalW公司;DNACLUST公司;SeqAn公司 PDF格式BibTeX公司 XML格式引用 \textit{R.Giancarlo}等人,Theor。计算。科学。792117-130(2019年;Zbl 1432.92062) 全文: 内政部 链接 参考文献: [1] 阿尔伯茨,B。;布雷,D。;刘易斯,J。;拉夫,M。;罗伯茨,K。;Watson,J.,《细胞分子生物学》(2002),加兰 [2] Struhl,K.,《真核生物和原核生物基因调控的根本不同逻辑》,《细胞》,98,1-4(1999) [3] Kornberg,R.D.,核小体在染色质中的位置:特异性还是统计性?,《自然》,292579-580(1981) [4] H.D.Ou、S.Phan、T.J.Deerinck、A.Thor、M.H.Ellisman、C.C.O'Shea、Chromemt:可视化间期和有丝分裂细胞中的三维染色质结构和致密性,《科学》357。;H.D.Ou,S.Phan,T.J.Deerinck,A.Thor,M.H.Ellisman,C.C.O’Shea,Chromem:可视化间期和有丝分裂细胞中的三维染色质结构和压实,科学357。 [5] 弗雷泽,J。;威廉姆森,I。;华盛顿州比克莫尔。;Dostie,J.,《基因组组织概述以及我们是如何做到的:从鱼类到hi-c、微生物。分子生物学。版次:79347-372(2015) [6] Hansen,美国。;Cattoglio,C。;达尔扎克,X。;Tjian,R.,最近关于tads和染色质环是动态结构的证据,Nucleus,9,20-32(2018) [7] Baumann,K.,《3D染色质组织愿景》,《分子细胞生物学》。,18, 532 (2017) [8] 费森菲尔德,G。;格鲁定,M.,《控制双螺旋》,《自然》,421448-453(2003) [9] 里奇,M。;Manzo,C。;García-Parajo,M.F。;拉卡达米亚利,M。;Cosma,M.,染色质纤维由体内不同核小体群形成,Cell,160,1145-1158(2015) [10] Hansen,J.C.,《人类有丝分裂染色体结构:30纳米纤维发生了什么?》?,EMBO J.,311621-1623(2012) [11] Tremethick,D.J.,《染色质的高阶结构:难以捉摸的30纳米纤维》,《细胞》,128,651-654(2007) [12] K.J.Meaburn,T.Misteli,《染色体区域》,《自然》445。;K.J.Meaburn,T.Misteli,《染色体区域》,《自然》第445页。 [13] 拉津,S.V。;Gavrilov,A.A.,《不含30纳米纤维的染色质:限制性紊乱而非层级折叠》,《表观遗传学》,第9、5、653-657页(2014年) [14] Rao,S.S。;黄,S.-C。;希莱尔,B.G.S。;Engreitz,J.M。;佩雷斯,E.M。;Kieffer-Kwon,K.-R。;桑伯恩,A.L。;约翰斯通,S.E。;Bascom,G.D。;博奇科夫,I.D。;黄,X。;沙米姆,M.S。;Shin,J。;特纳,D。;Ye,Z。;奥马尔,A.D。;罗宾逊,J.T。;Schlick,T。;伯恩斯坦,B.E。;卡塞拉斯,R。;兰德,E.S。;Aiden,E.L.,内聚素损失消除了所有环域,Cell,171,305-320(2017),e24 [15] 施瓦泽,W。;Abdennur,北。;Goloborodko,A。;Pekowska,A。;Fudenberg,G。;Loe-Mie,Y。;丰塞卡,N.A。;Huber,W。;Haering,C.H。;米尔尼,L。;Spitz,F.,《凝集素去除揭示的染色质组织的两种独立模式》,《自然》,551,51-56(2017) [16] 共和国奥尔郡。;Madhani,H.D.,异染色质形成和功能的十大原理,《自然评论》,《分子细胞生物学》。,19, 229-244 (2018) [17] 克罗西莫尔,M。;伊利·L。;Rytter,W.,《字符串中的重复:算法和组合学》,Theoret。计算。科学。,410, 5227-5235 (2009) ·Zbl 1180.68206号 [18] Lim,K.G。;Kwoh,C.K。;Hsu,L.Y。;Wirawan,A.,简介。生物信息。,14, 67-81 (2013) [19] Bannister,A.J。;Kouzarides,T.,组蛋白修饰对染色质的调节,《细胞研究》,21,381-395(2011) [20] Krietenstein,N。;沃尔,M。;渡边,S。;Park,B。;彼得森,C.L。;普格,B.F。;Korber,P.,用纯蛋白质重建的基因组核小体组织,Cell,167709-721(2016) [21] Radman-Livaja,M。;Rando,O.,核小体定位:它是如何建立的,为什么重要?,开发生物。,339, 2, 258-266 (2010) [22] 江,C。;Pugh,B.,《核小体定位和基因调控:基因组学进展》,《自然遗传学》。,10, 161-172 (2010) [23] 西格尔,E。;Fondufe-Mittendorf,Y。;Chen,L。;Thastrom,A。;菲尔德,Y。;摩尔,J。;Wang,J。;Widom,J.,核小体定位的基因组代码,《自然》,442772-778(2006) [24] 卡普兰,N。;印度摩尔。;Fondufe-Mittendorf,Y。;Gossett,A.J。;蒂洛,D。;字段,Y。;LeProust,E.M。;休斯·T·R。;Lieb,J.D。;Widom,J。;Segal,E.,《真核生物基因组的DNA编码核小体组织》,《自然》,458362-366(2009) [25] Kornberg,R。;Stryer,L.,核小体的统计分布:随机机制下的非随机位置,《核酸研究》,16,6677-6690(1988) [26] Charoensawan,V。;Janga,S。;布利克,M。;M.巴布。;Teichmann,S.,转录激活物的DNA序列偏好与核小体的相关性强于阻遏物,分子细胞,47,183-192(2012) [27] 洛克·G。;哈伯曼,D。;约翰逊,S.M。;Morozov,A.V.,C。核小体位置的整体重塑。雅致《BMC基因组学》,14,284(2013) [28] 西格尔,E。;Widom,J.,什么控制核小体位置?,趋势Genet。,746, 1-9 (2009) [29] 西格尔,E。;Widom,J.,Poly(dA:dT)tracts:核小体组织的主要决定因素,Curr。操作。斯特鲁克。《生物学》,19,65-71(2009) [30] Lorch,Y。;Maier Davis,B。;Kornberg,R.D.,DNA序列在染色质重塑和无核小体区域形成中的作用,《基因开发》,28,2492-2497(2014) [31] 布洛西,R。;Schiessel,H.,染色质重塑的最新进展,生物物理。J.,2255-2261(2018) [32] T.Mavrich,I.Ioshikhes,B.Venters,C.Jiang,L.Tomsho,J.Qi,S.Schuster,I.Albert,B.F.Pugh,用于在整个酵母基因组中核小体统计定位的屏障核小体模型,基因组研究。;T.Mavrich,I.Ioshikhes,B.Venters,C.Jiang,L.Tomsho,J.Qi,S.Schuster,I.Albert,B.F.Pugh,酵母基因组中核小体统计定位的屏障核小体模型,基因组研究。 [33] Teif,V.B.,《核小体定位:在线资源和工具》,简介。生物信息。,17, 745-757 (2016) [34] 海宁,M。;科罗梅-塔奇,M。;Taudt,A。;Rintisch,C。;Schafer,S。;Pravenec,M。;Hubner,N。;温格伦,M。;Johannes,F.,组蛋白:具有广泛基因组足迹的组蛋白修饰差异分析,BMC Bioninform。,16, 60 (2015) [35] 利布雷希特,M.W。;Noble,W.S.,《遗传学和基因组学中的机器学习应用》,《自然遗传学评论》。,16, 321-332 (2015) [36] 钟,J。;Wasson,T。;Hartemink,A.J.,《通过计算模型整合实验数据来学习蛋白质-dna相互作用景观》,生物信息学,302868-2874(2014) [37] 莫比乌斯,W。;Gerland,U.,屏障核小体模型的定量测试,用于转录起始位点上游和下游核小体的统计定位,PLoS Compute。生物,6,e891(2010) [38] Schones,D.E.,《核小体在人类基因组中定位的动态调节》,《细胞》,132887-898(2008) [39] Teif,V.B.,《核小体定位:在线资源和工具》,简介。生物信息。,17, 745-757 (2016) [40] 瓦卢耶夫,A。;一川,J。;Thaisan,T。;斯图亚特·J。;斯瓦蒂,R。;佩克姆,H。;曾,K。;Malek,J。;科斯塔·G。;McKernan,K。;Sidow,A。;火灾,A。;Johnson,S.M.,C.的高分辨率核小体位置图。雅致《基因组研究》,18,1051-1063(2008),揭示了缺乏通用序列定位 [41] 乌特罗,F。;Di Benedetto,V。;科罗纳,D.F。;Giancarlo,R.,序列的内在组合组织和信息论内容与真核生物基因组的DNA编码核小体组织相关,生物信息学,32835-842(2016) [42] Trifonov,E.,《理解人类基因组》(《人类基因组倡议和DNA重组》,结构和方法第1卷,生物分子立体动力学学科第六次对话论文集(1990年)),68-78 [43] De Luca,A。;Varricchio,S.,《半群和形式语言中的有限性和正则性》,专著。理论。计算。科学。EATCS系列。(1999),《施普林格:施普林格-海德堡》,德国·兹比尔0935.68056 [44] 盖,T.M。;Thomas,J.A.,《信息理论的要素》(1991),Wiley-Interscience:Wiley-Interscience美国纽约市·Zbl 0762.94001号 [45] 李,M。;Vitányi,P.M.B.,《科尔莫戈洛夫复杂性及其应用导论》(1997),斯普林格·弗拉格:斯普林格尔·弗拉格纽约市,美国纽约州·Zbl 0866.68051号 [46] Giancarlo,R。;Scaturro,D。;Utro,F.,《计算生物学中的文本数据压缩:概要》,生物信息学,251575-1586(2009) [47] Giancarlo,R。;Scaturro,D。;Utro,F.,《计算生物学中的文本数据压缩:算法技术》,《社会科学》。计算。第6版,第1-25页(2012年)·Zbl 1298.68087号 [48] 费拉吉纳,P。;Giancarlo,R。;Manzini,G。;Sciortino,M.,在最佳线性时间内增强文本压缩,J.ACM,52,688-713(2005)·Zbl 1323.68260号 [49] Mavrich,T。;江,C。;Ioshikhes,I。;李,X。;通风口,B。;桑顿,S。;Tomsho,L。;齐,J。;格拉泽,R。;舒斯特,S。;Gilmour,D。;艾伯特,I。;Pugh,B.,核小体组织果蝇属基因组,《自然》,453358-364(2008) [50] A.多林。;韦斯,D。;Rausch,T。;Reinert,K.,SeqAn,一个高效的通用C++库,用于序列分析,BMC Bioninform。,9, 11 (2008) [51] Gusfield,D.,《字符串、树和序列的算法:计算机科学和计算生物学》(1997),剑桥大学出版社:剑桥大学出版社,美国纽约市·Zbl 0934.68103号 [52] Giancarlo,R。;Rombo,S。;Utro,F.,高通量测序技术时代的压缩生物序列分析和存档,简报。生物信息。,15, 390-406 (2014) [53] 曹博士。;Dix,T.I.公司。;Allison,L。;Mears,C.,《生物序列压缩的简单统计算法》(IEEE数据压缩会议(DCC)(2007年),IEEE计算机学会),43-52 [54] Witten,I.H。;尼尔·R·M。;Cleary,J.G.,《数据压缩的算术编码》,Commun。ACM,30,520-540(1987) [55] Chen,J.Y。;Lonardi,S.,《生物数据挖掘》(2009),查普曼和霍尔 [56] 赞贝利,F。;Pesole,G。;Pavesi,G.,下一代测序时代前后的Motif发现和转录因子结合位点,Brief。生物信息。,14, 225-237 (2013) [57] S.E.Rombo,F.Utro,R.Giancarlo,SeqAn,Chapman&Hall/CRC数学与计算生物学的基本统计指数。;S.E.Rombo、F.Utro、R.Giancarlo,《SeqAn、Chapman和Hall/CRC数学与计算生物学的基本统计指数》。 [58] Apostolico,A。;博克,M.E。;Lonardi,S.,《惊讶的单调和对不寻常词汇的大规模探索》,J.Compute。生物,10,2/3,283-311(2003) [59] 佩克姆,H。;瑟曼,R。;Fu,Y。;Stamatoyannopoulos,J.A。;诺布尔,W。;斯特鲁尔,K。;Weng,Z.,基因组dna中的核小体定位信号,《基因组研究》,17,1170-1177(2007) [60] 蒂洛,D。;Hughes,T.,G+C含量主导内在核小体占有率,BMC Bioninform。,10, 442 (2009) [61] Giancarlo,R。;Rombo,S.E。;Utro,F.,《表观基因组k-mer词典:阐明序列组成如何影响核小体定位》体内,生物信息学,312939-2946(2015) [62] Ferraro Petrillo,美国。;Roscigno,G。;Cattaneo,G。;Giancarlo,R.,通过高效hadoop聚类算法对大基因组序列集合进行信息和语言分析,生物信息学,文章bty018 pp.(2018) [63] 盖恩,I。;Elisseeff,A.,《变量和特征选择简介》,J.Mach。学习。第3号决议,1157-1182(2003年)·兹比尔1102.68556 [64] Fawcett,T.,ROC分析简介,模式识别。莱特。,27, 8, 861-874 (2006) [65] Triola,M.,《初等统计学》(2012),培生:美国旧金山培生。 [66] Gordon,A.,《集群验证中的零模型》(Gaul,W.;Pfeifer,D.,《从数据到知识,分类研究、数据分析和知识组织》(1996),Springer:Springer-Berlin,Heidelberg),32-44 [67] Giancarlo,R。;Scaturro,D。;Utro,F.,微阵列数据中模式发现应用的计算聚类分析教程,数学。计算。科学。,1, 4, 655-672 (2008) ·Zbl 1181.68233号 [68] Giancarlo,R。;Utro,F.,《基于稳定性的聚类有效性和模型选择统计方法的算法范式及其在微阵列数据分析中的应用》,Theoret。计算。科学。,428, 58-79 (2012) ·Zbl 1238.68124号 [69] Ghodsi,M。;刘,B。;Pop,M.,DNACLUST:准确有效的系统发育标记基因聚类,BMC Bioninform。,12, 271 (2011) [70] 汤普森,J.D。;希金斯,D.G。;Gibson,T.J.,CLUSTAL W:通过序列加权、特定位置间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性,《核酸研究》,22,4673-4680(1994) [71] 克鲁克斯,G.E。;荣誉G。;钱多尼亚,J.-M。;Brenner,S.E.,《WebLogo:序列标志生成器》,《基因组研究》,第14期,第1188-1190页(2004年) [72] 西格尔,E。;Fondufe-Mittendorf,Y。;Chen,L。;塔斯特罗姆,A.C。;字段,Y。;印度摩尔。;王建平。;Widom,J.,核小体定位的基因组代码,《自然》,442772-778(2006) [73] S.Liu,L.Zhang,H.Quan,H.Tian,L.Meng,L.Yang,H.Feng,Y.Q.Gao,《从1D序列到3D染色质动力学和细胞功能:相分离视角》,bioRxiv,https://doi.org/10.101/255174; S.Liu,L.Zhang,H.Quan,H.Tian,L.Meng,L.Yang,H.Feng,Y.Q.Gao,《从1D序列到3D染色质动力学和细胞功能:相分离视角》,bioRxiv,https://doi.org/10.101/255174 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。