示例I:arrayCGH和外显子阵列数据
在第一个例子中,我们说明了不同的基因组数据集如何在一个集成的基因组图图解的。我们使用arrayCGH和Affymetrix外显子阵列数据,并将这些数据与Ensembl的基因组注释一起绘制。
我们首先加载基因组图包及其一个示例数据集。该数据集包含拷贝数数据和分段拷贝数数据,以及小基因组区域的外显子阵列数据。加载数据后gd对象为每个数据类型创建,即细分包含拷贝号段的对象通用数组对象包含原始副本号数据象形字表示我们正在绘制的相关染色体的对象通用数组包含外显子数组数据的对象,以及基因组轴基因组坐标轴的对象。
>库(基因组图)
>数据('exampleData',package='GenomeGraphs')
>seg=makeSegmentation(值=段,
start=segStart,end=segEnd,dp=DisplayPars(颜色=“躲避蓝2”,lwd=2,lty=“虚线”)
>copyNumber=makeGenericArray(强度=cn,probeStart=probeStart,
分段=seg,dp=DisplayPars(大小=3,颜色='seagreen',类型=“dot”)
>象形文字=make象形文字(染色体=3)
>expression=makeGenericArray(强度=强度,probeStart=exonProbePos,
dp=DisplayPars(color='darkred',type='point')
>基因组轴=生成基因组轴(add53=真,add35=真)
在下一步中,使用生物反应器包裹。我们首先连接到Ensemb BioMart数据库并选择人类(hsapiens公司)数据集。然后,我们检索我们想要可视化的区域的正向和反向链上的基因结构。
>最小基数=180292097
>最大基数=180492096
>mart=useMart('ensembl',dataset='hsapiens_gene_ensembl')
>genesplus=makeGeneRegion(start=minbase,end=maxbase,strand='+',chromosome='3',biomert=mart)
>genesmin=makeGeneRegion(start=minbase,end=maxbase,strand='-',chromosome='3',biomart=mart)
最后一步gd绘图调用函数来绘制的实例gd对象上面创建的。这些对象被赋予gd绘图作为列表,列表中的顺序将决定从上到下的打印顺序。最小和最大碱基位置也作为参数给出,以限制对该特定基因组区域的可视化。此示例生成的图如图所示1.
>gdPlot(列表(ideogram,expression,copyNumber,genesplus,genoAxis,genesmin),minBase=minBase,maxBase=maxBase)
示例二:转录亚型和外显子阵列数据
在第二个例子中,我们展示了来自Affymetrix基因芯片的探针级外显子阵列数据®人类Exon 1.0 ST平台(数据可从http://www.affmetrix.com)可以绘制Affymetrix的基因模型以及Ensembl的基因和转录注释。外显子阵列的数据没有绘制在探针的准确染色体位置,以便清楚地显示选择性剪接事件。大多数外显子在人类外显子1.0 ST平台上由四个探针表示。这四个探针的位置在数据图中等距分布。每个外显子由一条垂直线隔开,外显子通过连接线与其基因组位置相连。这种可视化可以很容易地将外显子阵列数据中观察到的替代外显子用法与Ensembl中已知的替代转录亚型联系起来(图2). 图中突出显示的区域显示了样本中未表达的外显子。为了生成这个图,我们首先创建gd对象即:标题,ExonArray公司,基因,成绩单、和图例物体。此外,我们使用注释轨道类。
>数据('unrData',package='GenomeGraphs')
>title=makeTitle(text='ENSG0000009307',color='darkred')
>col=colorRampPalette(c('firebrick2','dodgerblue2'))(长度(unrData[1,]))
>exon=makeExonArray(intensity=unrData,probeStart=unrPositions[,3],probeEnd=unrPlacess[,4],
probeId=as.character(unrPositions[,1),nProbes=unrNProbes,
dp=DisplayPars(color=col,mapColor='dodgerblue2'),displayProbesets=FALSE)
>affyModel<-makeAnnotationTrack(start=unrPositions[,3],end=unrLocations[,4],
feature=“gene_model”,group=“ENSG0000009307”,
dp=显示Pars(gene_model=“深蓝色”)
>gene=makeGene(id='ENSG00000009307',biomart=mart)
>transcript=makeTranscript(id='ENSG0000009307',biomart=mart)
>legend=makeLegend(text=c('afyModel','Ensembl Gene','Ensembl Transcript'),
fill=c(‘深绿色’,‘范围’,‘棕色蓝色’),cex=0.5)
在第二步中,我们使用矩形覆盖类创建高亮显示的区域,然后gd绘图生成集成图的函数。
>rOverlay=生成矩形覆盖(开始=115085100,结束=115086500,区域=c(3,5),
dp=显示Pars(alpha=.2,fill=“olivedrab1”)
>gdPlot(列表(标题、外显子、affyModel、基因、转录本、图例),minBase=115061061,maxBase=115102147,overlay=rOverlay)
第二个示例中生成的图如图所示2.
示例三:短读排序和平铺阵列数据
在最后一个例子中,我们展示了如何整合复杂多样的数据集,以便于联合分析,并通过展示酵母上各种已发布数据集的数据得出生物学结论。首先,我们构造一个列表,其中每个gd对象表示注释或公共可用数据集。我们绘制了来自Ensembl的数据,这是一个Illumina测序数据集[9],Affymetrix平铺阵列数据[10],核小体位置数据[11]和7个相关物种的保护数据[12].
>数据(“seqDataEx”,package=“GenomeGraphs”)
>str=seqDataEx$david[,“strand”]==1
>biomert=useMart(“集成”,“scerevisiae_gene_ensembl”)
>pList=列表(“-”=makeGeneRegion(染色体=“IV”,开始=1300000,结束=1310000,
strand=“-”,biomart=生物标记,
dp=显示参数(plotId=真,idRotation=0,cex=.5)),
makeGenomeAxis(dp=DisplayPars(byValue=1e3,size=3)),
“+”=makeGeneRegion(染色体=“IV”,开始=1300000,结束=1310000,
strand=“+”,biomart=biomart,
dp=显示参数(plotId=真,idRotation=0,cex=.5)),
“Nagalakshmi”=makeBaseTrack(base=seqDataEx$snyder[,“location”],value=seqData Ex$snyder[,“counts”]),
dp=显示Par(lwd=.3,color=“深蓝色”,ylim=c(0300)),
“David+”=makeGenericArray(probeStart=seqDataEx$David[str,“location”],
强度=seqDataEx$david[str,“expr”,下降=FALSE],
dp=显示Pars(pointSize=.5)),
“David-”=makeGenericArray(probeStart=seqDataEx$David[!str,“location”],
intensity=seqDataEx$david[!str,“expr”,drop=FALSE],
dp=显示Pars(color=“深绿色”,pointSize=.5)),
“Lee”=makeBaseTrack(base=seqDataEx$nislow[,“location”],
value=seqDataEx$nislow[,“evalue”],dp=DisplayPars(color=“grey”,lwd=.25)),
“保护”=makeBaseTrack(base=seqDataEx$Conservation[,“location”],
value=seqDataEx$conservation[,“score”],
dp=DisplayPars(color=“gold4”,lwd=.25))
构建了要绘制的元素列表后,我们现在使用矩形覆盖类,以突出显示感兴趣的区域。最后,我们使用gd绘图。虽然配置和设计初始绘图可能看起来很费力,但一旦我们有了这个基本结构,就可以轻松地为所有感兴趣的区域生成绘图。
>rOverlay=makeRectangleOverlay(开始=1302105,结束=1302190,区域=c(4,8),dp=DisplayPars(alpha=.2))
>gdPlot(pList,minBase=1301500,maxBase=1302500,overlay=rOverlay)
第三个示例中生成的图如图所示三.