快速质量控制
|
从BAM、SAM或FastQ文件导入数据(任何变体) 快速概述哪些方面可能存在问题 用于快速评估数据的摘要图表 将结果导出到基于HTML的永久报告 离线操作,无需运行交互式应用程序即可自动生成报告
文档
示例报告
变更日志
01-03-23:版本0.12.0发布 -
修复OSX上文件类型检测中的错误
01-03-23:版本0.12.0发布 -
将总基数添加到基本统计 添加dup_length选项以设置重复查找的截断级别 使默认截断长度始终为50bp 已从重复打印中删除重复数据消除的重复行 改进内存处理并向命令行添加--memory选项 将BAM解析移动到htsjdk 使颜色对色盲友好 生成图形的SVG版本,并添加--SVG选项以在报告中使用这些图形 为分析错误添加行号 更改要搜索的默认适配器序列
08-01-19:版本0.11.9发布 -
修复了分析空文件时的错误 增加了对多读fast5文件的支持 修复了适配器检测中的角盒错误 将JRE与OSX构建捆绑在一起,因此您不必安装它 修复了程序内存不足时挂起的问题
04-10-18:版本0.11.8发布 -
修复了高度重复序列中的性能错误 使用--nogroup运行时更改了序列长度模块的行为 其他小错误修复
10-01-18:版本0.11.7发布 -
修复了文件中第一个序列短于12bp时的崩溃
21-12-17:版本0.11.6发布 -
默认情况下禁用Kmer图 修复了使用长自定义适配器时的错误 更改了瓷砖编号截止线以适应novaseq 修复了ONT中纳米孔数据的各种格式更改 在污染物列表中添加了新的Clontech序列 添加了--min-length选项以删除短序列 添加了一个选项,用于指定流式传输到程序中的数据的输出名称
08-03-16:版本0.11.5发布 -
修正了小RNA适配器序列,使其在适配器内容图中的丰度不会被低估 修复了per-base序列内容图的警告/错误代码中的一个错误 修复了复制图文档中的错误
09-10-15:版本0.11.4发布 -
将OSX启动器更改为不依赖内部JVM框架,而是使用找到的任何命令行java 修复了其中一个适配器序列中的输入错误 修复了一个错误,该错误意味着在非交互式模式下,一些文件扩展名不会从报表名称中删除 使per-tile模块在limits.txt中禁用时不收集任何统计信息 修复了一个错误,该错误用于计算高度重复、有序且序列数很少的文件的重复 修复了读取组中观察值少于100个的per-base质量模块中的错误标记
25-3-15:版本0.11.3发布 -
修复了从limits.txt禁用per-tile图时的错误 修复了导致程序在处理多个文件实际完成时继续运行的错误 修复了一个错误,该错误意味着交互式应用程序中的格式选择不起作用 增加了对混淆样本id中的错误注意磁贴编号的检查 将SOLID smallRNA适配器添加到标准搜索集 修复了从未压缩的fastq文件中提取casava名称时的错误 增加了对Oxford Nanopore读取文件处理的支持
6-6-14:版本0.11.2发布 -
修复了per-seq质量图的错误警告/失败默认值 修复了Kmer和per-seq质量模块中的内存泄漏 添加了使用自定义限制文件的选项 修复了zip输出文件中文件夹的命名错误 修复了--extract选项中的错误
2-6-14:版本0.11.1发布 -
为所有模块添加了可配置的警告/失败阈值 允许有选择地关闭模块 为Illumina图书馆添加了一个质量图 添加了适配器内容图 改进了复制图 改进了Kmer模块 在HTML输出中使用嵌入式图形,以便您可以分发单个文件 添加了从stdin读取数据的功能 更改了基本分组的工作方式,以更好地适应长读取 放弃对Solexa64格式(NB)的支持 不 仍受支持的Phred 64)
3-5-12:版本0.10.1发布 -
添加了一个工作区以允许分析连接的gzipped文件 修复了FastQC安装在包含需要在URL中转义的字符的路径中时的错误 添加了一个选项来指定java解释器在命令行上的位置
9-9-11:版本0.10.0发布 -
添加了Casava模式以理智地处理最新illumina管道生成的多个fastq文件 修复了Kmer分析中的一个错误,该错误错过了每个序列中最后一个可能的Kmer 修复了在windows下使用包装器脚本时的类路径错误
31-8-11:发布0.9.6版本 -
修复了库中每个序列以poly-N结尾的崩溃 修复了启动包装器以在OSX上正确设置类路径
16-8-11:发布0.9.5版 -
修复了基于序列内容模块的文本输出中的一个错误 使进度报告绝对化,而不是近似化 添加了打印CSS样式,以便再次打印报告
13-7-11:版本0.9.4发布 -
改进了脱机应用程序中失败文件的错误报告
16-6-11:发布0.9.3版 -
添加了对bzip2压缩fastq文件的支持 为HTML报告添加了新的CSS主题,由Phil Ewels贡献
16-5-11:版本0.9.2发布 -
修复了一个错误,其中分组基数未在基础质量文本报告中报告 修复了分析小文件时Kmer分析中的崩溃
30-3-11:0.9.1版发布 -
在命令行中添加了--quiet和--nogroup选项 向基本统计信息添加了编码类型 增加了Illumina<1.3 1.3 1.5和1.9编码的检测
10-2-11:版本0.9.0发布 -
增加了对超长读取的支持(尤其是454和PacBio) 重复检测现在只使用每次读取的前50bp
21-1-11:0.8.0版发布 -
使所有图形更易于解释 添加了一个选项,仅分析BAM/SAM文件中的映射序列 添加了并行分析两个或多个文件的选项
24-11-10:版本0.7.2发布 -
修复了分析没有唯一序列的库时出现的错误 添加了一个选项,用于在命令行上指定自定义污染物列表
24-11-10:版本0.7.1发布 -
通过适当的选项和错误处理改进了命令行界面 添加了一个选项,以强制使用文件格式,而根据文件名猜测不起作用
27-10-10:版本0.7.0发布 -
增加了Kmer富集分析,以发现非对齐富集序列 已清理所有图形上的轴标签
27-10-10:版本0.6.1发布 -
修复了导致BAM/SAM文件中的某些序列和质量被反转的错误
18-10-10:版本0.6.0发布 -
现在可以从SAM/BAM格式文件中读取序列 在图形中添加了更平滑的线条
29-09-10:版本0.5.1发布 -
修复了文本输出中的格式错误 修复了%GC图,使其能够很好地与超过100bp的读数一起工作 改进了建模曲线与%GC图的拟合 在污染物文件中添加更多照明寡核苷酸
16-09-10:版本0.5.0发布 -
改进了正态分布对%GC图的拟合 计算重复序列模块中的总重复序列% 在HTML报告的每个部分旁边添加了通过/失败/警告图标 将图标和图像放入HTML报表中的子文件夹
30-07-10:版本0.4.3发布 -
修复了“基本统计信息”模块中的序列计数报告 在交互式应用程序中覆盖报告之前添加了警告
26-07-10:版本0.4.2发布 -
每基质量图上的固定y轴刻度 为缺少失败/警告检查的模块添加了失败/警告检测,并改进了现有检查 在每个序列的GC图中添加了一个建模分布 缩放长序列读取的报告图宽度
24-06-10:版本0.4.1发布 -
更改重复模块以减少长序列的内存使用 改变了重复级别的计算方式,使其更加真实
18-06-10:版本0.4发布 -
添加了序列复制级别模块 添加了一个lauch包装器,以便于从命令行使用 添加了完整的机器可解析输出以集成到管道中
28-05-10:版本0.3.1发布 -
修复了无效模板文件导致崩溃的错误 非交互式使用现在可以正确报告所有文件的进度,而不仅仅是第一个文件的进度 添加了一些缺少的文档
13-05-10:0.3版发布 -
添加了对gzip压缩fastq文件的支持 增加了对过度表达序列的识别 改进了颜色空间支持 添加了将非交互式报告保存到特定目录的选项
06-05-10:版本0.2发布 -
添加了对颜色空间fastq文件的支持 添加了模板支持,允许自定义HTML报告 默认情况下,解压缩了非交互式报告,并添加了一个选项来关闭此功能 将易于计算机读取的摘要文件添加到报告中
28-04-10:版本0.1.1发布 -
修复了一个在无头系统上阻止非交互使用的错误
26-04-10:版本0.1发布 -
9个模块的初始设置 交互式和离线操作功能