--- #图案匹配器[![生成状态](https://travis-ci.org/GreenleafLab/motifmatchr.svg?branch=master)](https://travis-ci.org/GreenleafLab/motifmatchr网站)##引言motismatcher是一个用于快速motif匹配的R包,使用MOODS库中的C++代码。MOODS库由Pasi Rastas、Janne Korhonen和Petri Martinmäki开发。MOOD版本MOODs 1.9.3代码的核心C++库已包含在此存储库中。##关于最近函数名更改的注释motifmatcher包最近更改为从snake_case切换到camelCase。所有导出的函数现在都使用camelCase,例如`match_motifs`现在是`matchMotifs`。如果遵循当前文档,但使用的是软件包的早期版本,请更新软件包或注意差异。此更改是为了符合Bioconductor命名首选项。##安装使用devtools包最容易安装。函数“install_github”将安装该包。```第页devtools::install_github(“GreenleafLab/motifmatcher”)```在此过程中安装了许多所需的软件包。其中一个依赖项对gsl库有系统要求,因此如果尚未安装,则可能需要单独安装。##match主题motismatcher的主要方法是`matchMotifs`。此方法有两个强制参数:1) 位置权重矩阵或位置频率矩阵,存储在TFBSTools包中的PWMatrix、PFMatrix或PFMatrixList对象中2) 一组基因组范围(GenomicRanges或RangedSummarizedExperiment对象)或一组序列(DNAStringSet、DNAString或简单字符向量)如果第二个论点是一组基因组范围,那么还需要基因组序列。如果基因组范围包括seqinfo,则默认情况下将使用seqinfo中指定的基因组(如果安装了相关的BSgenome包)。否则,如果安装了相应的BSgenome对象,则可以提供指定基因组构建的短字符串、BSgenone对象、DNAStringSet对象或fasta文件的FaFile对象点。该方法可以返回三个可能的输出,具体取决于“out”参数:1) (默认,with `out=“matches”`)布尔矩阵,指示哪些范围/序列包含哪些基序,存储为SummarizedExperiment对象的分析槽中的“matche”2) (`out=“scores”`)与(1)相同,再加上两个额外的分析——一个在每个范围/序列中具有高motif分数的矩阵(只有在匹配时才报告分数)和一个具有多个motif匹配的矩阵。3) (`out=“positions”`)包含输入范围/序列内所有匹配范围的GenomicRangesList。##快速启动```第页库(motifmatchr)库(GenomicRanges)#加载一些示例图案数据(example_motifs,package=“motismatcher”)#制作一组峰值峰值<-G范围(序列名=c(“chr1”、“chr2”、“chr2”),范围=I范围(开始=c(7658587342772928100183786),宽度=500))#获取图案匹配,例如山峰中的图案motif_ix<-matchMotifs(例如motifs,peaks,genome=“hg19”)motifMatches(motif_ix)#从SummarizedExperiment结果中提取匹配矩阵#获取峰中的图案位置,例如峰中的图形motif_ix<-matchMotifs(示例_motifs,峰值,基因组=“hg19”,out=“位置”)```##更多信息有关更详细的概述,请参见[vignette](https://greenleaflab.github.io/motifmatchr/articles/motifmaschr.html).