git克隆 https://github.com/lh3/minimap2网站 光盘 最小值2 && 制作 # 参照基因组的长序列 ./minimap2-a测试/MT-human.fa测试/MT-orang.fa > 测试sam # 首先创建索引,然后映射 ./minimap2-x map-ont-d MT-human-ont.mmi测试/MT-human.fa ./minimap2-MT-human-ont.mmi测试/MT-orang.fa > 测试sam # 使用预设(无测试数据) ./minimap2-ax地图-pb参考号fa pacbio.fq.gz > aln.sam公司 # PacBio CLR基因组读取 ./minimap2-ax映射参考号fa ont.fq.gz > aln.sam公司 # 牛津纳米孔基因组读数 ./minimap2-ax-map-hifi参考号fa pacbio-ccs.fq.gz > aln.sam公司 # PacBio HiFi/CCS基因组读取(v2.19或更高版本) ./minimap2-ax lr:hq参考号fa ont-Q20.fq.gz > aln.sam公司 # 纳米孔Q20基因组读取(v2.27或更高版本) ./minimap2-ax sr ref.fa read1.fa read2.fa > aln.sam公司 # 短基因组配对末端读数 ./minimap2-ax拼接参考fa rna-reads.fa > aln.sam公司 # 拼接长读取(链未知) ./minimap2-ax拼接-uf-k14参考fa读数.fa > aln.sam公司 # 噪声纳米孔直接RNA-seq ./minimap2-ax拼接:hq-uf参考fa查询.fa > aln.sam公司 # 最终PacBio Iso-seq或传统cDNA ./minimap2-ax拼接--连接床anno.bed12参考fa查询.fa > aln.sam公司 # 按注释连接的优先级排列 ./最小值2-cx asm5 asm1.fa asm2.fa > aln.paf公司 # 谱内asm-to-asm比对 ./minimap2-x ava-pb读数.fa读数.fa > 重叠.paf # PacBio读取重叠 ./minimap2-x ava-ont reads.fa reads.fa > 重叠.paf # 纳米孔读取重叠
# 详细命令行选项的手册页 男人/ 最低2.1
卷曲-L https://github.com/lh3/minimap2/releases/download/v2.28/minimap2-2.28_x64-linux.tar.bz2 | 焦油-jxvf- ./最小值2-2.28_x64-linux/minimap2
最小p2参考.fa查询.fq > 近似映射.paf
minimap2-c参考fa查询.fq > 对齐.paf
minimap2-参考fa查询.fq > 对齐.sam
minimap2-d参考号.mmi参考号fa # 索引 minimap2-参考号.mmi读取.fq > 对齐.sam # 对齐
minimap2-ax map-pb参考fa pacbio-reads.fq > aln.sam公司 # 用于PacBio CLR读取 minimap2-ax映射参考fa ont-reads.fq > aln.sam公司 # 牛津纳米孔读数 minimup2-ax映射iclr参考.fa iclr-reads.fq > aln.sam公司 # Illumina完整的长阅读
minimap2-ax拼接:hq-uf参考fa iso-seq.fq > aln.sam公司 # PacBio Iso-seq/传统cDNA minimap2-ax拼接参考fa纳米孔-cdna.fa > aln.sam公司 # 纳米孔2D cDNA-seq minimap2-ax拼接-uf-k14参考fa直接-rna.fq > aln.sam公司 # 纳米孔直接RNA-seq minimap2-ax拼接--拼接flank=无SIRV.fa SIRV-seq.fa # 针对SIRV控制的映射
paftools.js gff2bed anno.gff > 已发布 minimap2-ax拼接--junc-bed anno.bed ref.fa query.fa > aln.sam公司
minimap2-x ava-pb读数.fq读数.fq > ovlp.paf文件 # PacBio CLR读取重叠 minimap2-x avaont读取.fq读取.fq > ovlp.paf文件 # 牛津纳米孔读取重叠
最小p2-最大sr参考.fa读数-se.fq > aln.sam公司 # 单端对齐 minimap2-ax sr ref.fa read1.fq read2.fq > aln.sam公司 # 成对排列 minimap2-ax sr-ref.fa读取-交错.fq > aln.sam公司 # 成对排列
最小值2-最大值asm5参考fa asm.fa > aln.sam公司 # 装配到装配/参考对齐
CGATCGATAAGTAG——加塔加 || |||||||||||||||||| | CGATCG---AATAGAGTAGGTCGAATtGCA
-
阅读 -我 [= 4G网络 ]参考碱,提取物( -k个 , -w个 )-最小化器和 在哈希表中对它们进行索引。 -
阅读 -K(K) [= 2亿 ]查询库。 对于每个查询序列,执行步骤3 至7: -
对于每个( -k个 , -w个 )-最小化查询,对照参考检查 索引。 如果参考最小值不在顶部 -(f) [= 2e-4号机组 ]最多 频繁,收集它在引用中的出现次数,称为 种子 . -
按参考中的位置对种子进行排序。 用动态链接 编程。 每条链代表一个潜在的映射。 供阅读 重叠,报告所有链条,然后转至步骤8。 对于参考映射, 执行步骤5到7: -
让 P(P) 是主映射集,最初是一个空集。 对于 根据连锁得分从最好到最差的每条链:如果 在查询中,链与中的链重叠 P(P) 通过 --遮罩水平仪 [= 0.5 ]或较短链条的较高部分,将链条标记为 第二的 到中的链 P(P) ; 否则,将链添加到 P(P) . -
保留所有主映射。 还保留高达 -N个 [= 5 ]顶级次级 映射,如果其链接分数高于 -第页 [= 0.8 ]他们的 相应的主映射。 -
如果请求对齐,则筛选出可能的内部种子 导致长插入和长删除。 从 最左边的种子。 在内部种子之间执行全局对齐。 拆分 如果沿全球路线的累计分数下降 -z(z) [= 400 ]忽略了长时间的差距。 从最右边的种子延伸。 输出 链及其对齐。 -
如果输入中有更多的查询序列,请转至步骤2,直到没有更多 保留查询。 -
如果有更多的引用序列,请从头重新打开查询文件 并转至步骤1; 否则停止。
Li,H.(2018)。 Minimap2:核苷酸序列的成对比对。 生物信息学 , 34 :3094-3100. doi:10.1093/bioinformatics/bty191
李浩(2021)。 提高minimap2对齐精度的新策略。 生物信息学 , 37 :4572-4574. doi:10.1093/生物信息系统/btab705
-
Minimap2可能通过长时间的低复杂性产生次优排列 种子位置可能不太理想的区域。 这应该不会太大 担心,因为在这些区域,即使是最佳对齐也可能是错误的。 -
Minimap2需要x86 CPU上的SSE2指令或ARM CPU上的NEON指令。 确实如此 可以添加非SIMD支持,但这会使minimap2的速度减慢 多次。 -
Minimap2不适用于单个查询或数据库序列~2 十亿个基数或更长(准确地说是2147483647)。 所有的总长度 序列可以很好地超过这个阈值。 -
Minimap2经常遗漏小外显子。