计算机科学››2019,第46卷››问题(2): 301-305.数字对象标识:10.11896/j.issn.1002-137X.2019.02.046

• 交叉与前沿 • 上一篇   下一篇

基于彩色编码技术的准种重建算法

黄丹1,吴璟莉1,2,3  

  1. 广西师范大学计算机科学与信息工程学院 广西 桂林5410041
    广西师范大学广西多源信息挖掘与安全重点实验室 广西 桂林 5410042
    广西区域多源信息集成与智能处理协同创新中心 广西 桂林 541004
  • 收稿日期:2017-11-23 出版日期:2019-02-25 发布日期:2019-02-25
  • 通讯作者:吴璟莉(1978-),女,博士,教授,硕士生导师,共因失效会员,主要研究方向为生物信息学、算法设计与分析,电子邮件:wjlhappy@mailbox.gxnu.edu.cn
  • 作者简介:黄 丹(1993-),女,硕士生,主要研究方向为生物信息学
  • 基金资助:
    本文受国家自然科学基金项目(61363035,61762015,61502111,61662007),广西自然科学基金项目(2015GXNSFAA139288),“八桂学者”工程专项,广西多源信息挖掘与安全重点实验室系统性研究基金项目(14-A-03-02,15-A-03-02),广西科技基地和人才专项(AD16380008)资产

基于彩色编码技术的准物种重建算法

黄丹1,吴敬礼1,2,3  

  1. 广西师范大学计算机科学与信息技术学院,广西桂林5410041
    广西师范大学多源信息挖掘与安全广西重点实验室,广西桂林5410042
    广西多源信息集成与智能处理协同创新中心,广西桂林541004
  • 收到:2017-11-23 在线:2019-02-25 出版:2019-02-25

摘要:求解病毒准种单体型有助于了解其基因结构特点,对疫苗的研制及抗病毒治疗具有重要意义。文中通过引入模糊距离,构造一种带权的片段冲突图,并提出了基于彩色编码技术的病毒准种单体型重建算法CWSS公司无缝钢管算法先根据给定阈值对片段冲突图进行预处理;然后根据顶点的边权和及饱和度取值为图中顶点着色,着色遵循相邻顶点颜色相异的原则,直至所有顶点完成着色;最后将相同颜色的顶点片段进行组装,得到准种单体型。无缝钢管算法的时间复杂度为O(运行)(2氮+锰) 。采用模拟测序片段数据进行实验测试,对CWSS和Dsatur算法的重建性能和质量进行对比分析。实验结果显示,相比于土星,CWSS算法能获得更准确的准种单体型,具有更高的重建性能。

关键词: 彩色编码, 带权图, 单体型, 模糊距离, 准种

摘要:病毒准种单倍型的重建有助于了解病毒基因的结构,对疫苗制备和抗病毒治疗具有重要意义。本文通过引入模糊距离构建了加权片段冲突图,并提出了一种基于颜色编码技术的病毒准种单倍型重建算法CWSS。首先,CWSS算法根据给定的阈值对碎片冲突图进行预处理。其次,在相邻顶点必须具有不同颜色的条件下,根据边权重和饱和度值之和对图的所有顶点进行着色。最后,通过组装具有相同颜色的片段获得准种单倍型。CWSS算法的时间复杂度为O(2氮+锰).采用模拟序列片段比较CWSS算法和Dsatur算法的重建性能和质量。实验结果表明,与Dsatur算法相比,CWSS算法可以获得更精确的准物种和更高的重建性能。

关键词: 颜色编码, 模糊距离, 单倍型, 准物种, 加权图

中图分类号: 

  • TP301型
[1] 艾根·M,舒斯特·P·自然自组织超循环原理.超循环的出现[J]。Naturwissenschaften,1977,64(11):541-565。
[2] ANDINO R,DOMINGO E.病毒准种[J]。病毒学,2015479-480(1):46-51。
[3] DOMINGO E,SHELDON J,PERALES C.病毒准物种进化[J]。微生物与分子生物学评论Mmbr,2012,76(2):159-216。
[4] COX R J、BROKSTAD K A、OGRA P.Influ-enza病毒:免疫和疫苗接种策略。灭活流感疫苗和减毒活流感疫苗的免疫反应比较[J]。斯堪的纳维亚免疫学杂志,2004,59(1):1-15。
[5] LAURING A S,ANDINO R.准种理论与RNA病毒的行为[J]。《Plos病原体》,2010年6月(7):e1001005。
[6] BU D,TANG H.基于顶点着色算法的准物种重建[C]‖IEEE国际生物信息学和生物医学会议。华盛顿特区:IEEE计算机协会,2014:63-66。
[7] ERIKSSON N,PACHTER L,MITSUYA Y,等.用焦磷酸测序法估计病毒种群[J]。普洛斯计算生物损耗,2008,4(5):e1000074。
[8] MANCUSO N,TORK B,SKUMS P,等.利用Amplicon 454测序读数重建病毒准种[C]‖IEEE国际生物信息学和生物医学研讨会。华盛顿特区:IEEE计算机协会,2011:94-101。
[9] ZAGORDI O,BHATTACHARYA A,ERIKSSON N,et al.ShoRAH:从下一代测序数据估计混合样本的遗传多样性[J]。生物信息学,2011,12(1):1-5。
[10] HUANG A,KANTOR R,DELONG A,et al.QColors:一种从短且不连续的下一代测序读数中重建保守病毒准种的算法[J]。硅生物学,2011,11(5-6):193-201。
[11] BRON C,KERBOSCH J.算法457:寻找无向图的所有团[J]。Acm通讯,1973年,16(9):575-576。
[12] METZKER M L.测序技术——下一代[J]。《自然评论遗传学》,2010年,11(1):31-46。
[13] POH W T,XIA E,CHININMANU K,等.基于454序列的病毒准种推断[J]。BMC生物信息学,2013,14(1):355。
[14] ALTSCHUL S F,GISH W,MILLER W,等.基本局部对齐搜索工具[J]。《分子生物学杂志》,1990215(3):403-410。
[1] 刘胜久, 李天瑞, 谢鹏, 刘佳.
带权图的多重分形度量
加权图的多重分形测度
计算机科学, 2021, 48(3): 136-143.https://doi.org/10.11896/jsjkx.200700159
[2] 张倩,吴璟莉.
基于枚举策略的三倍体个体单体型重建算法
基于枚举策略的三倍体个体单倍体重建算法
计算机科学, 2017, 44(1): 75-79.https://doi.org/10.11896/j.issn.1002-137X.2017.01.014
[3] 姚华传,王丽珍,陈红梅,胡新.
CP_SDD+RDS:基于分行排序单向检测求解最近对
CP_SDD+RDS:一种基于行分割排序和单向检测的最近点对查找算法
计算机科学, 2013, 40(7): 201-205.
[4] 周伟 王建新 谢民主 陈建二.
单体型组装问题计算模型的比较与分析

计算机科学, 2008, 35(11): 166-169.
[5] 刘云龙 王建新 陈建二.
彩色编码技术的研究进展及应用

计算机科学, 2008, 35(1): 15-18.
[6] 王强.
最短路径问题的若干算法的编程

计算机科学, 2004年,31(B07):94-95。
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!