git克隆 https://github.com/jts/ncov-tools cd ncov工具
conda env create-f工作流/envs/environment.yml
康达安装-c康达锻造曼巴
mamba env create-f工作流/envs/environment.yml
conda激活ncov-qc
运行_200430/ 样本A.sorted.bam 样本A.共识.fasta 样本B分类.bam 样本B.共识.fasta 资源/ 文章参考.fasta 第3版/ nCoV-2019.床
#包含分析结果的顶级目录的路径 data_root:run_200430 #可选地,绘图可以有“运行名称”前缀。 如果未定义,则前缀将为“默认” 运行名称:my_run #nCov参考基因组的路径 reference_genome:resources/artic_reference.fasta参考基因组 #使用的测序平台可以是“牛津纳米孔”或“illumina” 平台:“牛津纳米孔” #包含引物的BED文件的路径,应遵循下载的格式 #ARTIC存储库 primer_bed:resources/V3/nCoV-2019.bed
#bam文件的命名约定 #这可以使用变量{dataroot}(如上所述)和{sample} #根据上面的示例,这将扩展为针对sampleA的run_200430/sampleA.sorted.bam bam_pattern:“{data_root}/{sample}.socted.bam” #一致序列的命名约定 consensus_pattern:“{dataroot}/{sample}.consonsus.fasta” #变量文件的命名约定,NF illumina运行通常使用 #“{data_root}/{sample}.variants.tsv和牛津纳米孔运行使用”{data_oot}/{simple}.pass.vcf.gz“ variants_pattern:“{dataroot}/{sample}.variants.tsv
metadata:“/path/to/metadata.tsv”
样本ct日期 样品A 20.8 2020-05-01 样本B 27.1 2020-06-02
# #如果提供了阴性对照的样本ID列表,则会生成一份包含金额的报告 #可以生成阴性对照中检测到的覆盖范围 # negative_control_samples:[“NTC-1”,“NTC-2”] # #在构建共识基因组树时,您可以选择包括其他序列 #在树中提供fasta文件 # tree_include_consensus:来自gisaid.fasta的一些基因组 #列出将从“primer_BED”创建的amplicon BED文件的类型。 这可能包括: #全扩增子,包括引物BED文件中列出的引物和重叠 #no_primers—包含重叠但删除了引物的扩增子 #unique_amplicons——删除了引物和重叠区域的不同扩增区 床类型:unique_amplicons #如果没有条目,则包含在SNP树图中的最小完整性阈值 #默认设置为0.75 完整性阈值:0.9 #要在QC报告中自动标记的突变集 #这可以是ncov-watch中内置的一个监视列表的名称 #或本地VCF文件的路径。 #内置列表: https://github.com/jts/ncov-watch/tree/master/ncov_watch/watchlists 突变集:峰值突变 #用户指定的输出目录 #默认为仅当前工作目录,否则为 #将输出文件写入指定目录 输出目录:run1_output #引物方案BED文件中使用的引物名称前缀,默认值 #值为“nCoV-2019”,用于ARTIC V3,请注意 #ARTIC V4.1使用`SARS-CoV-2` primer_prefix:“SARS-CoV-2”
#构建测序QC图(覆盖率、等位基因频率) snakemake-s工作流/Snakefile all_qc_sequenting #构建分析QC图(带注释突变的树) snakemake-s工作流/Snakefile all_qc_analysis #构建质量报告tsv文件(在qc_reports目录中) snakemake-s工作流/Snakefile all_qc_reports
#生成所有报告和绘图 snakemake-s工作流/Snakefile all
snakemake-s工作流/Snakefile all_final_report
#包含运行中每个样本的SARS-CoV-2参考基因组覆盖深度的图 plots/run_name_depth_by_position.pdf #包含所有样本覆盖范围的图,绘制为放大器的热图 plots/run_name_amplicon_coverage_heatmap.pdf #在每个样本中发现变异的图,绘制为带有相关SNP矩阵的树 plots/run_name_tree_snps.pdf #关于每个样本的质量指标和通过/警告/失败标准的报告 qc报告/运行名称摘要 #每个阴性对照的覆盖率报告 qc_reports/run_name_negative_control_report.tsv #一份关于基因组内位置的报告,这些位置在样本中始终不明确(可能的污染指标) qc_reports/run_name_ambigous_report.tsv #一份关于在多个位置有混合等位基因证据的样本的报告(该代码是实验性的,仍在测试中) qc_reports/run_name混合报告.tsv
snakemake-s工作流/Snakefile--核心1 build_snpeff_db
snakemake-s工作流/Snakefile--核心2 all_qc_annotation
穿山甲版本:“3”
pango_analysis_mode:“准确”
-
《树与SNPs》的情节灵感来自Mads Albertsen分享的一个情节。 -
要转换的脚本 方差.tsv 文件到 .vcf文件 已获取个文件 发件人: https://github.com/nf-core/viralrecon/blob/dev/bin/ivar_variants_to_vcf.py