×

关于无冲突DNA代码。 (英语) Zbl 1469.94171号

摘要:DNA存储已成为一个重要的研究领域。DNA存储系统的可靠性取决于设计那些足够不同的DNA串(称为DNA代码)。在这项工作中,我们引入了满足新引入的约束(非均聚物约束的推广)的DNA编码。特别是,DNA代码的每个码字都具有特定的属性,即DNA码字的任何两个连续子串都不相同。这与常见的约束条件不同,例如汉明约束、反向约束、反向补足约束和GC公司-内容。我们相信,本文提出的新约束将在减少读取和写入合成DNA字符串数据时的错误方面取得显著成就。我们还提出了一种结构(基于随机局部搜索算法的一种变体),以确定DNA代码的大小,其中除了通常的约束外,每个DNA码字都没有二级结构。在某些特定情况下,这进一步改进了现有文献的下限。还提出了二进制向量和DNA字符串之间的递归等距映射。通过将该映射应用于已知的二进制码,我们获得了具有上述所有约束的DNA码类,包括构造的DNA码字不受发夹状二级结构的限制。

MSC公司:

94B60码 其他类型的代码
68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
94B65个 代码的边界

软件:

百万倍
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 布拉瓦特,M。;盖德克,K。;Hütter,I。;陈,XM;Turczyk,B。;因弗索,S。;布鲁伊特,BW;Church,GM,DNA数据存储的前向纠错,Procedia Compute。科学。,80, 1011-1022 (2016) ·doi:10.1016/j.procs.2016.05.398
[2] Bornholt,J。;洛佩兹,R。;卡门,DM;Ceze,L。;Seelig,G。;Strauss,K.,基于DNA的存档存储系统,ACM SIGOPS操作系统。版次:50,2637-649(2016)·doi:10.1145/2954680.2872397
[3] 谢,YM;Ling,S.,恒定GC含量DNA代码的改进下限,IEEE Trans。Inf.理论,54,1,391-394(2008)·Zbl 1305.68077号 ·doi:10.1109/TIT.2007.911167
[4] Chheda,N.,Gupta,M.K.:RNA作为排列。arXiv:1403.5477v1(2014)
[5] Church,GM;高,Y。;Kosuri,S.,《DNA中的下一代数字信息存储》,《科学》,33761021628-1628(2012)·doi:10.1126/science.1226355
[6] 埃利希,Y。;Zielinski,D.,DNA Fountain实现了一个健壮高效的存储架构,Science,355,6328,950-954(2017)·doi:10.1126/science.aaj2038
[7] Gaborit,P。;King,OD,DNA代码的线性构造,Theor。计算。科学。,334, 99-113 (2005) ·Zbl 1080.68034号 ·doi:10.1016/j.tcs.2004.11.004
[8] 高盛,N。;伯顿,P。;陈,S。;Dessimoz,C。;EM LeProust;Sipos,B。;Birney,E.,合成DNA中实用、高容量、低维护的信息存储,《自然》,494,7435,77(2013)·doi:10.1038/nature11875
[9] Guenda,K.,Gulliver,T.A.,Solé,P.:关于循环DNA代码。摘自:IEEE信息理论国际研讨会论文集,第121-125页。doi:10.1109/ISIT.2013.6620200(2013)
[10] Immink,K.A.S.,Cai,K.:基于DNA的数据存储的约束代码的属性和构造。arXiv:1812.06798(2018)
[11] Jacobs,A.:永久数据存储(ETH Zürich,2015年2月13日https://www.ethz.ch/en/news-and-events/eth-news/news/2015/02/data-storage-for-eternity.html)
[12] Jain,S。;哈桑扎德,FF;施瓦茨,M。;Bruck,J.,《生物体DNA中数据存储的重复修正代码》,IEEE Trans。信息理论,63,8,4996-5010(2017)·兹比尔1372.94471 ·doi:10.1109/TIT.2017.2688361
[13] Kari,L.,Konstantinidis,S.,Losseva,E.,Sosík,P.,Thierrin,G.:DNA单词中的发夹结构。摘自:DNA计算,第158-170页(2006)·Zbl 1234.68216号
[14] Kiah,H.M.,Puleo,G.J.,Milenkovic,O.:DNA序列图谱的代码。摘自:IEEE信息理论国际研讨会论文集,第814-818页。doi:10.1109/ISIT.2015.7282568(2015)·Zbl 1359.94706号
[15] Kim,Y.S.,Kim,S.H.:从具有理想自相关的二进制序列中构建具有恒定GC含量的DNA代码。摘自:IEEE信息理论国际研讨会论文集,第1569-1573页。doi:10.1109/ISIT.2011.6033808(2011)
[16] 科瓦切维奇,M。;Tan,VYF,纠正DNA存储系统中固定长度重复错误的渐近最优代码,IEEE Commun。莱特。,22, 11, 2194-2197 (2018) ·doi:10.1109/LCOMM.2018.2868666
[17] Limbachiya,D.,Benerjee,K.G.,Rao,B.,Gupta,M.K.:关于使用环的DNA编码{Z} _4个+w\mathbb{Z} _4个 \). 摘自:IEEE信息理论国际研讨会论文集,第2401-2405页。doi:10.1109/ISIT.2018.8437313(2018)
[18] Limbachiya,D.,Gupta,M.K.:《自然数据存储:从现在到那时通过自然发送信息的回顾》。arXiv:1505.04890(2015)
[19] Limbachiya博士。;古普塔,MK;Aggarwal,V.,存档DNA数据存储的约束代码系列,IEEE Commun。莱特。,22, 10, 1972-1975 (2018) ·doi:10.1109/LCOMM.2018.2861867
[20] Limbachiya,D.,Rao,B.,Gupta,M.K.:《DNA串的艺术:DNA编码理论的十六年》。arXiv:1607.00266(2016)
[21] 北卡罗来纳州洛曼。;Misra,R。;Dallman,T。;Constantinidou,C。;Gharbia,S。;Wain,J。;Pallen,M.,台式高通量测序平台的性能比较,国家生物技术。,30, 6, 434-439 (2012) ·doi:10.1038/nbt.2198
[22] Lothare,M.,《单词组合学》(1997),剑桥:剑桥数学图书馆。剑桥大学出版社·Zbl 0874.20040 ·doi:10.1017/CBO9780511566097
[23] A.马拉太。;康顿,AE;Corn,RM,关于组合DNA单词设计,J.Compute。生物学,8,3,201-219(2001)·Zbl 0969.68070号 ·doi:10.1089/10665270152530818
[24] Milenkovic,O.,Kashyap,N.:避免二级结构的DNA代码。摘自:IEEE信息理论国际研讨会论文集,第288-292页。doi:10.1109/ISIT.2005.1523340(2005)
[25] 穆勒,DE,布尔代数在开关电路设计和错误检测中的应用,I.R.E.电子计算机专业小组学报,EC-3,3,6-12(1954)·doi:10.1109/IREPGELC.1954.6499441
[26] Myers,P.、Sebaihia,M.、Cerdeño-tárraga Bentley,S.、Crossman,L.、Parkhill,J.:串联重复和形态变异。《自然》(2007)
[27] Nelms,B.L.,Labosky,P.A.:预测的发夹状簇与PCR障碍相关。测序和可能的BAC重组科学报告1106(2011)
[28] Ridge,P.,Carroll,H.,Sneddon,D.,Clement,M.,Snel,Q.:大粒度随机优化比对。摘自:IEEE生物信息学和生物工程研讨会论文集,第127-134页。doi:10.1109/BIBE.2006.253325(2006)
[29] Rykov,V.V.,Macula,A.J.,Torney,D.C.,White,P.S.:DNA序列和四元循环码。摘自:IEEE信息理论国际研讨会论文集,第248-248页。doi:10.1109/ISIT.2001.936111(2001)
[30] DH史密斯;Aboluion,N。;蒙特曼,R。;Perkins,S.,具有Hamming距离d和恒定GC含量的DNA代码的线性和非线性构造,离散。数学。,311, 13, 1207-1219 (2011) ·Zbl 1215.94087号 ·doi:10.1016/j.disc.20100.03.005
[31] Song,W。;蔡,K。;张,M。;Yuen,C.,基于DNA的数据存储的运行长度和GC约束代码,IEEE Commun。莱特。,22, 10, 2004-2007 (2018) ·doi:10.1109/LCOMM.2018.2866566
[32] 汤姆森,N。;Sebaihia,M。;Cerdeño-tárraga Bentley,S。;克罗斯曼,L。;Parkhill,J.,《比较的价值》,《国家微生物学评论》,1,11,11-12(2003)·数字对象标识代码:10.1038/nrmicro734
[33] Tulpan,D。;DH史密斯;Montemanni,R.,满足hamming距离和反向补全约束的DNA编码的热力学后处理与含GC的预处理,IEEE/ACM Trans。计算。生物信息学。,11, 2, 441-452 (2014) ·doi:10.1109/TCBB.2014.2299815
[34] Tulpan,D.C.,Hoos,H.H.,Condon,A.E.:DNA单词设计的随机局部搜索算法。摘自:DNA计算,第229-241页(2003年)·兹比尔1026.68564
[35] Yakovchuk,P。;Protozanova,E。;Frank-Kamenetskii,医学博士,DNA双螺旋热稳定性中的碱封和碱封贡献,Nuclice Acis Res.,34,2,564-574(2006)·doi:10.1093/nar/gkj454
[36] 亚兹迪,SHT;袁,Y。;马,J。;赵,H。;Milenkovic,O.,基于DNA的可重写随机访问存储系统,《科学报告》,第5期,第14138页(2015年)·doi:10.1038/srep14138
[37] Zhu,X.,Sun,C.,Liu,W.,Wu,W.:基于DNA编码线性构造的计数问题研究。摘自:《计算智能与生物信息学学报》,第294-302页(2006年)
[38] Zuker,M.,用于核酸折叠和杂交预测的Mfold web服务器,《核酸研究》,31,13,3406-3415(2003)·doi:10.1093/nar/gkg595
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。