跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
2004年12月9日5:193。
doi:10.1186/1471-2105-5-193。

功能注释分析与Catmap的比较

附属机构
比较研究

功能注释分析与Catmap的比较

托马斯·布雷斯林等人。 BMC生物信息学

摘要

背景:微阵列实验中的排序基因列表通常通过为预定义的基因类别指定重要性来进行分析,例如基于功能注释。执行此类分析的工具通常仅限于基于排名列表中的截止值的类别分数和基于随机基因排列的显著性计算(作为无效假设)。

结果:我们分析了三个公开的数据集,每个数据集的样本分为两类,基因根据它们与类别标签的相关性进行排序。我们开发了一个程序Catmap(可从以下网址下载http://bioinfo.thep.luse/Catmap),比较基因类别分析中的不同分数和零假设,使用基因本体注释进行类别定义。当使用基于截止值的分数时,结果强烈依赖于截止值的选择,这在分析中引入了任意性。比较随机基因排列和随机样本排列的结果,我们发现类别的指定意义强烈依赖于零假设的选择。与样本标签排列相比,基因排列对于含有许多共表达基因的大类别给出的p值要小得多。

结论:在对排名基因列表进行基因类别分析时,最好使用截止独立得分。零假设的选择非常重要;随机基因排列不能很好地近似于样本标签排列。

PubMed免责声明

数字

图1
图1
比较零假设.比较第页-使用van’t Veer的数据集,通过样本标签排列和基因排列获得的值.[13](左),Golub[11](中间)和Alon.[20](右)。样本标签排列结果为van’t Veer的100.000个排列.数据集和其他数据集的10.000排列。按照方法中的描述计算基因置换结果。红色、绿色和蓝色分别代表1至5、6至20和20多个基因的类别。左图中的圆形方框表示类别“M相”和“羧酸代谢”,文中对此进行了进一步讨论。
图2
图2
共表达对不同零假设的影响.在van’t Veer的97个样本上的表达式配置文件[13],分别是“M期”类别中排名最靠前的12个基因(左)和“羧酸代谢”类别中的13个排名最靠后的基因(右)。一些基因被颠倒了,因为排名是基于与转移类别的绝对相关值。无转移样本位于垂直线的左侧,在每个转移类别中,样本按检测基因的平均表达增加排序。样本中每个基因的表达均归一化为零平均值。左图中较窄的表达带说明M期基因的皮尔逊相关性较高。对于M期基因,基因表达之间的平均绝对皮尔逊相关为0.74,标准偏差为0.16,对于羧酸代谢基因,为0.44,标准差为0.27。
图3
图3
设置有效数量的独立类别.多类别第页-值,第页倍数,与第页-van’t Veer数据集的值[13],使用了327个大的基因本体类别,其中包含20个以上的基因。黄色带显示基于1000个随机列表的样本标签排列结果的95%置信区间,蓝色曲线显示等式(1)的结果,拟合N个效率=152(实线),类别总数N个=327(虚线),以及Bonferroni校正(虚线法)。

类似文章

引用人

工具书类

    1. Zeeberg BR、Feng W、Wang G、Wang MD、Fojo AT、Sunshine M、Narasimhan S、Kane DW、Reinhold WC、Lababidi S、Bussey KJ、Riss J、Barrett JC、Weinstein JN。戈米纳:基因组和蛋白质组数据的生物学解释资源。基因组生物学。2003;4:R28。doi:10.1186/gb-2003-4-4-r28。-内政部-项目管理咨询公司-公共医学
    1. Robinson MD、Grigull J、Mohammad N、Hughes TR.Funspec:基于网络的酵母集群解释器。BMC生物信息学。2002;3:35. doi:10.1186/1471-2105-3-35。-内政部-项目管理咨询公司-公共医学
    1. Khatri P,Draghici S,Ostermeier GC,Krawetz SA。使用onto-express分析基因表达。基因组学。2002;79:266–270. doi:10.1006/geno.2002.6698。-内政部-公共医学
    1. Doniger SW、Salomonis N、Dahlquist KD、Vranizan K、Lawlor SC、Conklin BR。Mappfinder:使用基因本体论和genmapp从微阵列数据创建全局基因表达谱。基因组生物学。2003;4:R7。doi:10.1186/gb-2003-41-r7。-内政部-项目管理咨询公司-公共医学
    1. Beissbarth T,Speed T.GOstat:在一组基因中发现统计上表现过度的基因本体。生物信息学。2004;20:1464–1465. doi:10.1093/bioinformatics/bth088。-内政部-公共医学

出版物类型