×

用逆耦合重写系统对序列和树上的动态规划问题进行建模。 (英文) Zbl 1461.68251号

摘要:动态规划是一种经典的算法范例,它通常允许在多项式时间内计算指数大小的搜索空间。递归问题分解、中间结果列表以供重复使用以及Bellman的最优原则是其众所周知的组成部分。然而,算法往往缺乏抽象性,难以实现,调试繁琐,修改困难。本文提出了一个用于指定动态编程问题的通用框架。该框架可以处理各种顺序输入以及树结构数据。生物序列分析、文档处理、分子结构分析、以层次结构方式组装的对象的比较,以及通常考虑的所有域,其中字符串和有序根树用作自然数据表示。新方法引入了逆耦合重写系统它们将组合优化问题的解决方案描述为一个项重写关系的逆映像,该关系将问题解决方案简化为问题输入。这个规范导致了动态编程算法的简明而透明的规范。它们的实际实现可能具有挑战性,但正如我们希望的那样,最终可以自动生成。本文通过描述计算生物学领域中出现的一组不同的动态规划问题,以及生物序列和分子结构分析中的示例,展示了这种新方法的范围。

MSC公司:

68周05 非数值算法
2012年第68季度 语法和重写系统
90C27型 组合优化
90立方厘米 动态编程
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 贝尔曼,R.E;动态编程:普林斯顿,新泽西,英国1957·Zbl 0077.13605号
[2] Gusfield,D;字符串、树和序列的算法:计算机科学和计算生物学:剑桥,英国1997·Zbl 0934.68103号
[3] Needleman,S.B。;Wunsch,C.D。;一种适用于寻找两种蛋白质氨基酸序列相似性的通用方法;分子生物学杂志:1970; 第48卷,443-453页。
[4] T.F.史密斯。;沃特曼,M.S。;常见分子子序列的识别;分子生物学杂志:1981; 第147卷,195-197年。
[5] 桑科夫,D。;同时解决RNA折叠、排列和原序列问题;SIAM J.应用。数学。:1985; 第45卷,810-825·Zbl 0581.92012号
[6] Ferch,M。;张杰。;Höchsmann,M。;利用状态-动作空间的图表示学习协同装配;IEEE/RSJ智能机器人和系统国际会议论文集:。
[7] Reis,D。;Golgher,P。;席尔瓦,A。;Laender,A。;基于树编辑距离的网络新闻自动提取;第十三届万维网国际会议记录:,502-511.
[8] Searls,D.B。;DNA和定冠词文法的语言学研究;北美逻辑编程会议论文集:剑桥,马萨诸塞州,美国1989年,189-208.
[9] 西尔斯,D.B。;生物序列的计算语言学;人工智能与分子生物学:美国马萨诸塞州剑桥市,1993年,47-120.
[10] Searls,D.B。;生物序列的语言学研究;CABIOS:1997年;第13卷,333-344。
[11] 列斐伏尔;几种对齐和折叠算法的基于语法的统一;AAAI智能。系统。分子生物学:1996; 第4卷,143-154。
[12] 克努思,D.E。;上下文无关语言的语义;理论计算。系统:1968; 第2卷,127-145·Zbl 0169.01401号
[13] Giegerich,R。;梅耶,C。;斯特芬,P。;序列数据动态规划的一门学科;科学。计算。程序:2004; 第51卷,215-263·Zbl 1067.90157号
[14] Giegerich,R。;斯特芬,P。;编译动态编程领域特定语言的挑战;2006年ACM应用计算研讨会论文集:。
[15] Höner zu Siederdissen,C。;绕过concatMap:动态编程的高效组合子;第17届ACM SIGPLAN功能编程国际会议论文集:2012年美国纽约州纽约市,215-226. ·Zbl 1291.68122号
[16] 索托夫,G。;Möhl,M。;詹森,S。;Giegerich,R。;Bellman的GAP-A语言和编译器,用于序列分析中的动态编程;生物信息学:2013;第29卷,551-560。
[17] 巴德,F。;Nipkow,T;术语改写及所有内容:英国剑桥,1998年·Zbl 0948.68098号
[18] Ohlebusch,E;学期改写高级主题:纽约,纽约,美国2002·Zbl 0999.68095号
[19] 俄亥俄州哥托市。;一种改进的生物序列匹配算法;分子生物学杂志:1982; 第162705-708卷。
[20] 杜宾,R。;Eddy,S.R。;Krogh,A。;Mitchison,G;生物序列分析:蛋白质和核酸的概率模型:英国剑桥,1998年·Zbl 0929.92010号
[21] Giegerich,R。;动态规划中模糊性的解释与控制;组合模式匹配会议录:纽约,纽约,美国2000年,46-59. ·Zbl 0964.90050号
[22] Nussinov,R。;Pieczenik,G。;格里格斯,J。;克莱特曼,D。;循环匹配算法;SIAM J.应用。数学。:1978; 第35卷,第68-82页·Zbl 0411.92008号
[23] 贝克,J.K。;语音识别的可训练语法;J.声学。Soc.Am.:1979年;第65卷,第54-550页。
[24] Sakakibara,Y。;布朗,M。;Hughey,R。;我·棉恩。;Sjölander,K。;安德伍德,R。;Haussler,D。;使用随机上下文无关语法进行RNA建模的最新方法;组合模式匹配1994:,289-306页。
[25] Dowell,R。;Eddy,S。;几种用于RNA二级结构预测的轻量级随机无上下文文法的评价;BMC生物信息:2004; 第5卷,第71页。
[26] 姜涛(Jiang,T.)。;林·G。;马,B。;张,K。;RNA结构之间的一般编辑距离;J.计算。生物学:2002年;第9卷,371-388。
[27] 姜涛(Jiang,T.)。;Wang,L。;张,K。;树对齐-树编辑的替代方法;西奥。计算。科学:1995; 第143卷,第137-148页·Zbl 0873.68150号
[28] T.J.Macke。;艾克,D.J。;R.R.古特尔。;Gautheret,D。;案件,D.A。;桑帕斯,R。;RNAMotif,一种RNA二级结构定义和搜索算法;核酸研究:2001;第29卷,4724-4735。
[29] Reeder,J。;Reeder,J。;Giegerich,R。;运动基序:从图形基序描述到RNA基序搜索;生物信息学:2007年;第23卷,i392。
[30] Eddy,S.R。;杜宾,R。;基于协方差模型的RNA序列分析;核酸研究:1994年;第22卷,2079-2088。
[31] Giegerich,R。;Höner zu Siederdissen,C。;随机RNA家族模型的语义和歧义性;IEEE/ACM传输。计算。生物信息:2011; 第8卷,499-516页。
[32] 加德纳,P。;Daub,J。;泰特,J。;Nawrocki,E。;科尔贝,D。;林德格林,S。;威尔金森,A。;R·芬恩。;Griffiths-Jones,S。;Eddy,S。;Rfam:RNA家族数据库更新;核酸研究:2009年;第37卷,D136。
[33] 罗塞洛,F。;瓦伦特,G。;关于最大公共子树和最小公共超树关系的代数观点;西奥。计算。科学:2006; 第362卷,第33-53页·Zbl 1111.68091号
[34] Chawathe,S。;比较外部存储器中的层次数据;第25届超大数据库国际会议记录:1999年,90-101.
[35] Touzet,H。;带间隙的树编辑距离;信息处理。信函:2003; 第85卷,第123-129页·Zbl 1011.68851号
[36] 王卓志,K.Z。;两种RNA结构之间的比对;计算机科学数学基础:2001,690-702. ·Zbl 1070.92515号
[37] 巴科芬,R。;陈,S。;Hermelin,D。;兰道,G.M。;Roytberg,文学硕士。;O.魏曼。;张,K。;RNA比较中的位置和差距;J.计算。生物学:2007年;第14卷,1074-1087。
[38] Jansson,J。;新界邱。;Sung,W.K。;局部间隙亚林比对及其在RNA结构基序发现中的应用;J.计算。生物学:2006年;第13卷,702-718·Zbl 1116.68670号
[39] Schirmer,S。;Giegerich,R。;具有仿射间隙和锚点的森林定线;组合模式匹配:纽约,纽约,美国2011,104-117. ·Zbl 1339.68212号
[40] 杜卢克,S。;Touzet,H。;树编辑距离问题的分解算法;J.离散算法:2005年;第3卷,448-471·Zbl 1129.68099号
[41] Erik Demaine,Shay Mozes,B.R。;O.魏曼。;树编辑距离的最优分解算法;ACM事务处理。算法:2009年;第6卷·Zbl 1300.68057号
[42] 索托夫,G。;詹森,S。;Giegerich,R。;Bellman的GAP:一种用于动态编程的声明语言;2011年美国纽约州纽约市第十三届国际ACM SIGPLAN声明性编程原则与实践研讨会论文集,29-40.
[43] Searls,D.B。;K.P.墨菲。;变异与比对的自动机理论模型;ISMB会议记录,1995年:,341-349.
[44] Huet,G。;兰克福德,D。;术语重写系统的一致暂停问题;1978; .
[45] 鲍威尔,W.B;近似动态规划:解决维度的诅咒:纽约,纽约,美国2007·兹比尔1156.90021
[46] 伏安,B。;Giegerich,R。;Rehmsmeier,M。;完整的RNA形状概率分析;BMC生物:2006; 第4卷,第5卷。
[47] Sedgewick,R;算法:Reading,MA,USA 2002·Zbl 0529.68002号
[48] 科尔曼,T。;Leiserson,C。;铆钉,R;算法导论:美国马萨诸塞州剑桥市,1990年·Zbl 1158.68538号
[49] 布拉埃尔(Braßel,B.)。;哈纳斯,M。;Peemöller,B。;雷克,F。;KiCS2:从curry到haskell的新编译器;第20届功能和(约束)逻辑编程国际研讨会论文集:2011年美国纽约州纽约市,1-18.
[50] 汤普森,S;哈斯克尔:《函数编程手艺》:波士顿,马萨诸塞州,美国2011年。
[51] 艾斯纳,J。;西北部菲拉多;Dyna:为现代人工智能扩展数据日志。数据日志2.0:美国纽约州纽约市,2011年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。