Cd命中 swMATH ID: 16887 软件作者: 李伟忠、亚当·戈德齐克 描述: Cd-hit:一个快速程序,用于聚类和比较大量蛋白质或核苷酸序列。动机:2001年和2002年,我们发表了两篇论文(《生物信息学》,第17、282–283页,《生物信息》,第18、77–82页),描述了一个名为cd-hit的超快蛋白质序列聚类程序。这个程序可以有效地将具有数百万序列的巨大蛋白质数据库聚类。然而,底层算法的应用不仅限于蛋白质序列聚类,这里我们提出了几个使用相同算法的新程序,包括cd-hit-2d、cd-hit-est和cd-hit-est-2d。Cd-hit-2d比较了两个蛋白质数据集,并报告了它们之间的类似匹配;cd-hit-est对DNA/RNA序列数据库进行聚类,并对两个核苷酸数据集进行比较。所有这些程序都可以处理包含数百万序列的巨大数据集,比基于流行序列比较和数据库搜索工具(如BLAST)的方法快数百倍。可利用性:http://cd-hit.org 主页: http://weizhongli-lab.org/cd-hit/ 相关软件: 细胞PLoc;伦敦银行支持向量机;爆炸;PSI-爆炸;UniProt公司;iRSpot-PseDNC公司;PseAAC-建筑商;PseAAC公司;哼-mPLoc;iSNO-PseAAC公司;欧盟-mPLoc;财产;iLoc-Hum公司;iPro54-PseKNC;肌肉;R(右);EMBOS公司;iLoc-Euk公司;PLMLA公司;iAMP-2L型 引用于: 35文件 全部的 前5名134位作者引用 三 丁辉 2 胡雪海 2 拉文德拉·库马尔 2 林浩 2 史少平 2 阿比希哈·斯利瓦斯塔瓦 2 杨磊 2 左永春 1 法曼·阿里 1 阿兰戈·阿尔戈托,G.A。 1 仲裁员,盖伊 1 穆罕默德·礼萨 1 Dimitri Panteli贝尔塞卡斯 1 布莱恩·布鲁巴赫 1 蔡玉东 1 曹,伙计 1 曹仁智 1 曹胜娇 1 卡鲁戈语、奥利维埃罗语 1 日尔曼卡斯特拉诺斯·多明古斯 1 柴、海亭 1 陈国栋 1 陈伟 1 陈彦光 1 陈永兵 1 洛林·克劳福德 1 戴、齐国 1 蒂塔拉吉·达什 1 马蒂亚斯·德梅尔 1 阿卜杜拉·德赞吉 1 丁一杰 1 杜普峰 1 段晓东 1 曼苏尔·易卜拉希米 1 伊斯梅尔·易卜拉希米 1 弗兰克·艾森哈伯 1 冯、彭敏 1 高彦欣 1 葛、李 1 杰·古尔耶 1 郭飞 1 郭新云 1 郭彦之 1 韩,叶 1 法尔瓦·哈桑 1 哈亚特,马克苏德 1 他,费 1 基尔·希佩 1 胡东刚 1 黄超 1 黄树云 1 黄、燕 1 卡桑德拉·亨特 1 贾拉米洛·加松,J.A。 1 纪金超 1 姜伟 1 萨拉·卡利什尼克·维罗夫舍克 1 乔纳森·基思(Jonathan M.Keith)。 1 汗、里达·萨瓦尔 1 Shmuel Tomi Klein 1 班达纳库马里 1 苏尼尔·普兰特·拉尔 1 李公兵 1 李国斌 1 李梦龙 1 李彦达 1 李一雪 1 梁汝平 1 刘波 1 刘嘉国 1 刘梦汉 1 约斯万·洛佩兹 1 陆金龙 1 陆玲怡 1 卢千子 1 吕英丽 1 马代川 1 马志强 1 保罗·梅德韦杰夫 1 米,刚 1 雅各布·迈克尔森 1 苏坎塔·蒙达尔 1 莫诺德、安提亚 1 穆罕默德·莫拉迪·沙赫巴巴克 1 宁,乔 1 牛晓辉 1 Pai,Priyadarshini P。 1 潘晓勇 1 潘毅 1 帕蒂尼奥·加林多,胡安·安格尔 1 朱利亚·佩德里利 1 皮埃尔·佩特隆戈 1 爸爸,米海 1 埃里克·波普莱顿 1 钱子良 1 邱建丁 1 克里斯托弗·萨林 1 阿卜杜勒·萨塔尔 1 达纳·夏皮拉 1 阿洛克·夏尔马 …还有34位作者 全部的 前5名9篇连载文章中引用 20 理论生物学杂志 三 数学生物科学与工程 2 计算生物学和化学 2 分子生物学方法 1 数学生物学杂志 1 神经网络 1 信息计算杂志 1 医学中的计算和数学方法 1 SIAM应用代数和几何杂志 全部的 前5名10个领域引用 33 生物学和其他自然科学(92-XX) 14 计算机科学(68至XX) 10 统计学(62-XX) 1 总体主题;集合(00-XX) 1 代数几何(14-XX) 1 测量和集成(28-XX) 1 欧氏空间的调和分析(42至XX) 1 代数拓扑(55-XX) 1 运筹学、数学规划(90-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 按年份列出的引文