跳到主要内容

功能注释分析与Catmap的比较

摘要

背景

微阵列实验中的排序基因列表通常通过为预定义的基因类别指定重要性来进行分析,例如.,基于功能注释。执行此类分析的工具通常仅限于基于排名列表中的截止值的类别分数和基于随机基因排列的显著性计算(作为无效假设)。

结果

我们分析了三个公开的数据集,每个数据集的样本分为两类,基因根据它们与类别标签的相关性进行排序。我们开发了一个程序Catmap(可从以下网址下载http://bioinfo.thep.luse/Catmap),在基因类别分析中比较不同的分数和零假设,使用基因本体论注释进行类别定义。当使用基于截止值的分数时,结果强烈依赖于截止值的选择,这在分析中引入了任意性。比较随机基因排列和随机样本排列的结果,我们发现类别的指定意义强烈依赖于零假设的选择。与样本标签排列相比,基因排列要小得多第页-具有许多共表达基因的大类别的值。

结论

在对排名基因列表进行基因类别分析时,最好使用截止独立得分。零假设的选择非常重要;随机基因排列不能很好地作为样本标签排列的近似值。

背景

在全基因组微阵列实验中,可以分析许多不同类别基因的相关性,这些基因是从数据库注释形式的先验知识或其他实验中获得的。这些基因注释分析可以揭示有关不同表型的通路和细胞功能的新信息。最近开发了有助于此过程的计算工具[18]尤其是基于基因本体(GO)的注释[9]. 通常,类别相关性计算为第页-分数的值,因此取决于分数的选择和零假设的选择。

在微阵列分析中,如聚类分析,它提供了定义的基因子集,没有内部排名,评分自然基于相关子集中类别基因的数量。然而,基因排序出现在许多微阵列分析技术中,例如基因表达与靶谱的相关性[10]以及通过区分实验条件的能力对基因进行评分[1113]. 通过引入截止点,可以很容易地从排序基因列表中分离出相关和不相关的基因,但截止点的选择变得有些武断,列表中的信息也会丢失。解决这一问题的工具采用了科尔莫戈罗夫·斯米尔诺夫评分(Kolmogorov-Smirnov score),该评分采用了独立于等级截断的基于等级的评分[1417]和基于最小截止值的第页-价值[7,8],优化了每个类别的截止值。威尔科森秩和[18]在这里进行的调查也有同样的目的。

要计算第页-指定分数的值需要一组基因列表,根据所选的无效假设进行排序。无效假设最简单的选择就是随机基因排列,对于一些基于等级的分数第页-然后可以分析计算值,而无需显式执行置换。然而,随机基因排列无效假设假设基因表达与生物样本无关第页-因此,值是第页-类别的重要性以及第页-共存类别的基因的值。当类别基因在广泛的实验条件下表现相似时,共表达并不表明类别与研究问题的相关性。因此,在许多分析中,更合适的零假设是样本标签排列,其中根据基因表达与样本随机排列目标值的相关性生成一组排名基因列表。这种方法解释了类别基因之间的相关性,并给出了第页-由数据集中样本的可能排列数从下方限定的值。后者在样本较少的数据集中尤为重要。尽管如此,公开可用的基因注释分析工具仅限于基因排列[18].

我们提出了一个基于排序基因列表的基因类别分析程序Catmap。该程序使用高于临界值的基因数量或Wilcoxon秩和作为分数,并且可以从用户提供的一组排序列表中计算分数的显著性,从而允许样本标签排列。此外,该程序使用排列结果计算多类别测试的校正,以评估有效的独立类别数,这使Catmap能够估计非常小的多类别第页-值,否则在计算上是不可行的。程序的输入是两个文件和一些参数。第一个文件包含与生物学相关的基因排名列表,如果需要,还包含从无效假设中提取的其他排名基因列表。第二个文件包含类别及其对应的基因。输入参数可以在命令行或设置文件中指定,如下所示:1)在截止分数和Wilcoxon秩和分数之间进行选择;2) 零假设的选择,其可以是上述用户提供的排序列表或随机基因排列;3) 多类别测试中使用的排列数。如果为零,则不执行多类别测试。

Catmap的输出是两个文件。主输出文件包含所有类别,每行一个,根据其重要性排序。类别的行包含第页-价值,多重比较第页-值、错误发现率、ROC面积(这是表示Wilcoxon秩和的标准化方法)、类别中的基因数以及秩的第25、50和75个百分位。另一个输出文件,即配套文件,包含所有类别,所有基因及其等级如下所示。每一行包含一个基因及其等级。该程序可在以下网址下载:[19],其中还可以访问文件格式规范和示例文件。

结果和讨论

比较非截止值和基于截止值的评分函数

我们分析了van’t Veer的乳腺癌数据集. [13]具有基于截止值的评分功能,使用不同的截止值。1显示15个类别的结果第页-来自截止独立评分的值,表明第页-价值在很大程度上取决于截止点的选择。这进一步通过基于最小截止值的非常不同的截止值来说明第页-获得了值。提供了一个包含所有类别的表格作为补充[参见附加文件2].

表1类别第页-基于截止值和独立于截止值的评分函数的值。Wilcoxon秩和最低的15个GO类别第页-基于van t Veer数据集的排名基因列表中的值共包含5224个基因。三列显示第页-基于截止值的分数函数的值,截止值位于列表中的位置100、300和600。列“min第页“和”cuttop“给出了基于第页-值和达到此最小值的截止值。“WRS”列给出了第页-以Wilcoxon秩和作为得分函数,基因随机排列作为零假设计算的值,标记为#genes的列表示该类别中的基因总数。完整的表格(按WRS排序第页-值)作为补充信息[参见附加文件2]. 补充表还包含了使用不同方法对每个类别的排名以及排名列表中这些基因的第25、50和75个百分位。

与基于截止值的备选方案之间的差异相比,结果如表所示1对于两个独立的截止点是合理一致的第页-值,使用Wilcoxon秩和和基于最小截止值第页-值。这个第页-基于Wilcoxon秩和的值通常大于基于最小截止值的值第页-值。由于后者受到最小化过程的影响,因此必须将其解释为分数,而不是第页-值,因此需要进行额外分析以发现统计显著性[7,8].

比较零假设

使用Wilcoxon秩和,我们比较了不同零假设的结果。研究了三个公开可用的数据集[11,13,20]. 如图所示1,第页-基于基因排列的值往往低于基于样本标签排列的值。对于较小的类别第页-值,存在显著差异,尤其是对于包含20个以上基因的大类别。由于基因置换无效假设假设了独立的基因,我们预计基因不相关的GO类别具有大致相同的基因第页-在两种不同的零假设下的值,而基因高度相关的重要类别的值会更低第页-值使用基因置换无效假设。为了说明这种共表达效应,我们选择了两大类,“羧酸代谢”和“M相”,如图所示1在van’t Veer的数据集中. [13],“羧酸代谢”与第页-两个零假设的值,而“M阶段”有一个第页-值为10-7使用基因排列,但更高第页-值为3·10-2使用样本标签排列。如图所示2“M期”排名最高的基因确实比“羧酸代谢”排名最靠前的基因更为共存。

图1
图1

比较零假设.比较第页-使用van’t Veer的数据集,通过样本标签排列和基因排列获得的值.[13](左),Golub[11](中间)和Alon.[20](右)。样本标签排列结果为van’t Veer的100.000个排列.数据集和其他数据集的10.000排列。按照方法中的描述计算基因置换结果。红色、绿色和蓝色分别代表1至5、6至20和20多个基因的类别。左图中的圆形方框表示类别“M相”和“羧酸代谢”,文中对此进行了进一步讨论。

图2
图2

共表达对不同零假设的影响.在van’t Veer的97个样本上的表达式配置文件[13],分别是“M期”类别中排名最靠前的12个基因(左)和“羧酸代谢”类别中的13个排名最靠后的基因(右)。一些基因被颠倒了,因为排名是基于与转移类别的绝对相关值。无转移样本位于垂直线的左侧,在每个转移类别中,样本按检测基因的平均表达增加排序。样本中每个基因的表达均归一化为零平均值。左图中较窄的表达带说明了M期基因的较高Pearson相关性。对于M期基因,基因表达之间的平均绝对皮尔逊相关为0.74,标准偏差为0.16,对于羧酸代谢基因,为0.44,标准差为0.27。

在表中2比较了不同零假设的类别等级。有明显的差异,前十大类别之间只有一小部分重叠。正如上面所讨论的,我们可以清楚地看到基因置换无效假设的趋势,即找到包含很多基因的类别。附录中提供了一个包含所有类别的表格[参见附加文件3].

表2不同截断独立方法的比较。四种方法中每种方法的前十个类别及其对应等级:带有样本标签置换无效假设(s.l.p.)的威尔科克森秩和(WRS)、带有基因置换无效假设的WRS、GSEA中使用的科尔莫戈罗夫·斯米尔诺夫评分(K-s)[17]以及基于最小截断值的第页-值(最小值-第页) [7, 8]. 百分位列表示排名基因列表中第25、50和75个百分位的位置,该列表包含5224个基因,基于范特维尔的数据集最后一列表示每个类别中的基因数量。完整表格作为补充文件提供[参见附加文件3].

2还显示了使用两个可选的截断独立评分函数获得的类别排名:GSEA中使用的Kolmogorov-Smirnov评分[17]以及基于最小截止值的第页-FuncAssociate中使用的值[7]和iGA[8]. 这两个备选方案不计算个人p-类别的值,但根据所选分数对类别进行排名。然而,他们给出的结果与通过Wilcoxon秩和和基因置换获得的结果相似。这是意料之中的,因为第页-通过基因排列计算值,并在GSEA中采用得分[17]与科尔莫戈罗夫·斯米尔诺夫(Kolmogorov-Smirnov)相似,对类别进行排名第页-基于基因排列的值就可以了。应该注意的是,GSEA、FuncAssociate和iGA计算了多个修正的假设第页-值,但这些不会更改类别的排名。

可能存在差异(表中未显示其本身2)在Kolmogorov-Smirnov得分和最小化之间第页-一方面是价值评分,另一方面是Wilcoxon秩和,用于处理只有一部分基因表达与研究问题显著相关的类别。如果剩余的看似无关紧要的基因按预期随机分布在排名列表中,则位于排名列表顶部的重要基因将为该类别的所有三个评分功能打好分。然而,如果这些不太重要的基因在列表中的位置高于随机预期(尽管不足以影响Kolmogorov-Smirnov或min-第页分数),威尔科森秩和将认为该类别更重要。相反,如果不太重要的类别基因在列表底部占优势,Wilcoxon秩和得分函数将认为该类别不重要,而其他两个得分将仅基于排名靠前的基因赋予该类别高度显著性。看起来不重要的基因的排名是否比随机预期的结果更好或更差,这当然是一个口味问题,也有可能是使用几个评分函数,它们可以相互补充。然而,如表所示,这些差异远小于与选择零假设相关的差异2.

多类别测试

测试的类别越多,就越有可能至少有一个类别得到非常小的第页-偶然的价值。为了更好地评估最佳评分类别的统计显著性,我们使用Catmap通过排列测试计算错误发现率和家族错误率。这也为我们提供了有效数量的独立类别,N个效率,如方法中所述。

GO包含许多小类别,在针对生物学结论的研究中可以合理忽略这些小类别,它们包括在图中1主要是为了突出零假设之间的差异。在进行多类别测试时,我们将研究局限于包含20多个基因的大类别。我们分别测试了3个子本体(生物过程、分子功能和细胞成分)。

正如上面的讨论所预期的那样,一些共表达基因的类别变得很小第页倍数随机基因排列的错误发现率很低。相反,当使用样本标签排列时,最小的第页倍数在van’t Veer的数据集中获得. [13]生物过程类别“有机酸代谢”包含83个基因,p=3.10-4第页倍数= 0.02. 有趣的是,文献中已知有机酸代谢与乳腺癌相关[21,22]. 对于这个数据集和生物过程类别,前15个类别中的错误发现率为38%。

对于所有3个子本体,类别的有效数量,N个效率,约占全部类别数量的一半,N个在van’t Veer的数据集中. [13]这些数字是N个效率=83与N个生物过程=166,N个效率=69与N个=119(分子功能),以及N个效率=22与N个=42,对于蜂窝组件。对于所有类别,大类别的实际数量为N个=327,而N个效率= 152. 使用相同数据集和类别的随机基因排列,我们得到N个效率= 170. 事实上N个效率因为这两个零假设非常接近,这是我们在所有示例中看到的一个普遍现象(数据未显示)。此外,对于所研究的所有数据集和本体,N个效率约占类别总数的一半。如果这是GO类别的一般特征,那么简单的Bonferroni校正对于小型第页-值。

3表明与有效类别数的拟合较好;在排列结果可用的范围内,其偏差不超过2倍。图中的示例3通过100.000个样本标签排列获得,并且最小第页-1000个随机基因列表的值被发现。

图3
图3

设置有效数量的独立类别.多类别第页-值,第页倍数,与第页-van’t Veer数据集的值[13],使用了327个大的基因本体类别,其中包含20个以上的基因。黄色带显示基于1000个随机列表的样本标签排列结果的95%置信区间,蓝色曲线显示等式(1)的结果,拟合N个效率=152(实线),类别总数N个=327(虚线),以及Bonferroni校正(虚线法)。

应该注意的是,无论何时在项目中检查多个排名列表,都应该纠正这种多假设测试的额外来源。Corá给出了基于截止值的分数函数的这种修正的示例. [23].

结论

我们开发了一个计算机程序,用于计算基因排序列表中基因类别的重要性。程序可以执行多类别测试的修正。为了研究不同分数和零假设的性质,我们分析了三个公开的数据集[11,13,20]. 通常情况下[16],相关基因的子集是通过在列表中引入截止值从已排序的基因列表中定义的。我们的结果表明第页-生物相关类别的值在很大程度上取决于截止值的选择。独立于截止点的Wilcoxon秩和分数克服了这个问题,代表了Kolmogorov-Smirnov分数的另一种选择[1417]以及基于最小截止值的第页-价值[7,8]. 三个截止独立分数的类别排名非常相似。

尽管在许多情况下,样本标签排列比基因排列代表了更好的零假设,但可用的基因注释分析工具仅限于后者。我们的实现允许两个空假设,并且我们发现第页-值和类别的排名在很大程度上取决于零假设的选择。与样本标签排列相比,基因排列要小得多第页-具有许多共表达基因的大类别的值。

方法

算法

实现的算法按顺序独立地处理类别。作为类别相关性的得分函数,该程序使用Wilcoxon秩和或排序列表中高于给定临界值的基因数量。后者用于方法比较和定义相关基因子集的情况,无需内部排序。

对于Wilcoxon秩和的情况,用户可以提供一组根据适当的零假设分布的秩表,或请求基因的随机排列作为零假设。在后一种情况下,得分的重要性由程序通过迭代法、高斯近似或连续体积近似的精确计算进行分析计算。程序根据精度和计算时间之间的平衡来选择方法。详细信息见补充信息[参见附加文件1].

对于基于截止值的分数函数的情况第页-类别相关性的值是通过Fisher精确检验确定的[24]对应于随机排列的基因为零假设。

什么时候?N个独立类别同时进行测试,家庭错误率只是指计算概率,

第页倍数(q个) = 1 - (1 -q个)N个,     (1)

至少有一个类别具有第页-低于任何给定数字的值q个这是偶然的。对于相关类别,我们假设相同的函数形式描述第页倍数(q个),使用N个替换为有效数量的独立类别N个效率。我们发现N个效率通过生成数字,K(K),在空假设下的有序列表,并计算第页-所有类别的值。我们很适合N个效率使用最大似然估计

哪里第页 k个 是最小的第页-的值k个第个排序列表。

的错误发现率j个排名最高的类别是通过计算第页-值来自K(K)排列的列表低于第页-的值j个:th类别,并将此数字除以K(K)·j个。对于样本标签排列,当用户提供的一组排名基因列表用于表示无效假设时,第一个K(K)列表用于查找N个效率和错误发现率,其余列表用于计算第页-每个的值K(K)列表。

实施

该算法在Perl程序Catmap.pl中实现,并根据GNU通用公共许可证(GPL)发布。Catmap.pl以及用户说明可在以下网址下载:[19].

公共数据集

使用Catmap,我们分析了三个公开的数据集,其中包含来自基因本体的基因注释。

van’t Veer的数据集. [13]由97例原发性散发性乳腺癌患者组成,其中46例在治疗后5年内发生转移。按中所述执行质量筛选[13],并呈现约5000个基因,这些基因根据其与转移类别的绝对皮尔逊相关性进行排序。之前已经对数据集进行了基因本体分析,将231个顶级基因作为重要基因和随机基因排列的子集[25].

Golub的数据集. [11]包括白血病患者的骨髓样本,27例AML患者和11例ALL患者。公布的数据包含5000个基因的表达水平,剔除样本间无差异的基因后,得到4812个基因,这些基因根据其与白血病类型的绝对皮尔逊相关性进行排名。

Alon的数据集. [20]包括40个肿瘤和22个正常结肠组织样本。已发布数据集中的2000个基因根据其与组织类型的绝对皮尔逊相关性进行排序。

基因本体协会

所有基因首先被映射到相应的UniGene簇[26]. 对于Golub的数据集. [11]该映射是从Affymetrix提供的芯片注释文件中给出的,而对于其他数据集[13,20],映射是通过GenBank登录号完成的。使用ACID提取UniGene簇的GO注释[27],并通过反向传播GO图上的所有低级别关联来完成。

工具书类

  1. Zeeberg BR、Feng W、Wang G、Wang MD、Fojo AT、Sunshine M、Narasimhan S、Kane DW、Reinhold WC、Lababidi S、Bussey KJ、Riss J、Barrett JC、Weinstein JN:戈米纳:基因组和蛋白质组数据的生物学解释资源。 基因组生物学2003,4:R28.10.1186/gb-2003-4-4-R28

    第条 公共医学中心 公共医学 谷歌学者 

  2. Robinson医学博士、Grigull J、Mohammad N、Hughes TR:Funspec:一个基于web的酵母集群解释器。 BMC生物信息学2002,三:35. 10.1186/1471-2105-3-35

    第条 公共医学中心 公共医学 谷歌学者 

  3. Khatri P、Draghici S、Ostermeier GC、Krawetz SA:使用onto-express分析基因表达。 基因组学2002,79:266–270. 2006年10月10日/geno.2002.6698

    第条 中国科学院 公共医学 谷歌学者 

  4. Doniger SW、Salomonis N、Dahlquist KD、Vranizan K、Lawlor SC、Conklin BR:Mapfinder:使用基因本体和genmapp从微阵列数据创建全局基因表达谱。 基因组生物学2003,4:R7.10.1186/gb-2003-4-1-R7

    第条 公共医学中心 公共医学 谷歌学者 

  5. Beissbarth T,速度T:GOstat:在一组基因中发现统计上表现过度的基因本体。 生物信息学2004,20:1464–1465. 10.1093/生物信息学/bth088

    第条 中国科学院 公共医学 谷歌学者 

  6. Hosack DA、Dennis G Jr、Sherman BT、Lane HC、Lempicki RA:在EASE基因列表中识别生物学主题。 基因组生物学2003,4:R70.10.1186/gb-2003-4-10-R70

    第条 公共医学中心 公共医学 谷歌学者 

  7. Berriz GF、King OD、Bryant B、Sander C、Roth FP:用functassociate表征基因集。 生物信息学2003,19:2502–2504. 10.1093/生物信息学/btg363

    第条 中国科学院 公共医学 谷歌学者 

  8. Breitling R、Amtmann A、Herzyk P:迭代群分析(iGA):一种提高微阵列实验敏感性和促进解释的简单工具。 BMC生物信息学2004,5:34. 10.1186/1471-2105-5-34

    第条 公共医学中心 公共医学 谷歌学者 

  9. Ashburner M、Ball CA、Blake JA、Botstein D、Butler H、Cherry JM、Davis AP、Dolinski K、Dwight SS、Eppig JT、Harris MA、Hill DP、Issel-Tarver L、Kasarskis A、Lewis S、Matese JC、Richardson JE、Ringwald M、Rubin GM、Sherlock G:基因本体:生物学统一的工具。基因本体联盟。 自然基因2000年,25:25–29. 10.1038/75556

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  10. Spellman PT、Sherlock G、Zhang MQ、Iyer VR、Anders K、Eisen B、Brown PO、Botstein D、Futcher B:利用微阵列杂交技术对酿酒酵母细胞周期调控基因的综合鉴定。 分子生物学细胞1998,9:3273–3297.

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  11. Golub TR、Slonim DK、Tamayo P、Huard C、Gaasenbeek M、Mesirov JP、Coller H、Loh ML、Downing JR、Caligiuri MA、Bloomfield CD、Lander ES:癌症的分子分类:通过基因表达监测进行分类发现和分类预测。 科学类1999,286:531–537. 10.1126/科学286.5439.531

    第条 中国科学院 公共医学 谷歌学者 

  12. Khan J、Wei JS、Rinnér M、Saal LH、Ladanii M、Westermann F、Berthold F、Schwab M、Antonescu CR、Peterson C、Meltzer PS:使用基因表达谱和人工神经网络对癌症进行分类和诊断预测。 自然·医学2001,7:673–679. 10.1038/89044

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  13. van’t Veer LJ、Dai H、van de Vijver MJ、He YD、Hart AA、Mao M、Peterse HL、van der Kooy K、Marton MJ、Witteveen AT、Schreiber GJ、Kerkhoven RM、Roberts C、Linsley PS、Bernards R、Friend SH:基因表达谱预测乳腺癌的临床结局。 自然2002,415:530–536. 10.1038/415530a

    第条 公共医学 谷歌学者 

  14. 科尔莫戈罗夫AN:Sulla determinazione experimenta di una legge di distribuzione公司。 Giorn Dell Inst Ital Degli Attuari公司1933,4:83–91.

    谷歌学者 

  15. 斯米尔诺夫内华达州:关于估计两个独立样本的经验分布曲线之间的差异。 公牛莫斯科大学1939,2个:3–16.

    谷歌学者 

  16. Jensen LJ、Knudsen S:基于全细胞表达数据和功能注释自动发现启动子区域的调控模式。 生物信息学2000,16:326–333. 10.1093/生物信息学/16.4.326

    第条 中国科学院 公共医学 谷歌学者 

  17. Mootha VK、Lindgren CM、Eriksson KF、Subramanian A、Sihag S、Lehar J、Puigserver P、Carlsson E、Ridderstrale M、Laurila E、Houstis N、Daly MJ、Patterson N、Mesirov JP、Golub TR、Tamayo P、Spiegelman B、Lander ES、Hirschorn JN、Altshuler D、Groop LC:参与氧化磷酸化的PGC-1α应答基因在人类糖尿病中协调下调。 自然基因2003,34(3):267–73. 10.1038/ng1180

    第条 中国科学院 公共医学 谷歌学者 

  18. 威尔科森F:通过排名方法进行个人比较。 生物计量学1945,1个:80–83.

    第条 谷歌学者 

  19. Catmap网站[http://bioinfo.thep.luse/Catmap]

  20. Alon U、Barkai N、Notterman DA、Gish K、Ybara S、Mack D、Levine AJ:寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示了广泛的基因表达模式。 《美国科学院院刊》1999,96:6745–6750. 10.1073/pnas.96.12.6745

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  21. 库哈伊达FP:脂肪酸合成酶与人类癌症:关于其在肿瘤生物学中作用的新观点。 营养2000,16:202–208. 10.1016/S0899-9007(99)00266-X

    第条 中国科学院 公共医学 谷歌学者 

  22. Kumar-Shinha C、Ignatoski KW、Lippman ME、Ethier SP、Chinnaiyan AM:her2的转录组分析揭示了脂肪酸合成的分子联系。 癌症研究2003,63:132–139.

    中国科学院 公共医学 谷歌学者 

  23. Cora D、Di Cunto F、Provero P、L Silengo P、Caselle M:通过对共享过度表达上游基序的基因集进行功能分析,计算识别转录因子结合位点。 BMC生物信息学2004,5:57. 10.1186/1471-2105-5-57

    第条 公共医学中心 公共医学 谷歌学者 

  24. 费舍尔RA:在分类问题中使用多重测量。 安·尤根1936,7:179–188.

    第条 谷歌学者 

  25. Draghici S、Khatri P、Martins RP、Ostermeier GC、Krawetz SA:基因表达的全局功能分析。 基因组学2003,81:98–104.2016年10月10日/S0888-7543(02)00021-6

    第条 中国科学院 公共医学 谷歌学者 

  26. 非重复序列[http://www.ncbi.nlm.nih.gov/UniGene网站]

  27. 林格纳·M、维埃拉·S、安德森·S、斯塔夫·J、哈基宁·J:ACID:微阵列克隆信息的数据库。 生物信息学2004,20分:2305–2306. 10.1093/生物信息学/bth089

    第条 公共医学 谷歌学者 

下载参考资料

致谢

MK和TB感谢瑞典战略研究基金会的财政支持。PE由瑞典战略研究基金会通过Lund干细胞生物学和细胞治疗中心提供支持。作者还感谢卡斯珀·阿斯特鲁普·埃里克森(Kasper Astrup Eriksen)、彼得·约翰逊(Peter Johansson)、亨利克·约翰逊(Henrik Johansso)、卡斯滕·彼得森(Carsten Peterson)和马库斯·林格(Markus Rignér)进行了富有成果的讨论。

作者信息

作者和附属机构

作者

通讯作者

与的通信莫滕·克罗赫.

其他信息

作者的贡献

TB和MK在Catmap中实现了这些算法。所有作者都参与了研究的设计,准备、阅读并批准了最终手稿。

电子补充材料

作者提交的原始图像文件

下面是作者提交的原始图像文件的链接。

图1的作者原始文件

图2的作者原始文件

图3的作者原始文件

权利和权限

转载和许可

关于本文

引用这篇文章

Breslin,T.,Edén,P.&Krogh,M.将功能注释分析与Catmap进行比较。BMC生物信息学 5, 193 (2004). https://doi.org/10.1186/1471-2105-5-193

下载引文

  • 收到:

  • 已接受:

  • 出版:

  • 内政部:https://doi.org/10.1186/1471-2105-5-193

关键词