正选择在确定疾病物种差异的分子原因中的作用
,1 ,2 ,三 ,2 ,2 ,2 ,2 ,2 ,4 ,2 ,2 ,1和2 杰西卡·瓦马蒂万
1英国伦敦WC1E 6BT高尔街达尔文大厦伦敦大学学院生物系
萨米乌尔·哈桑
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
理查德·D·埃姆斯
三基尔大学医学科学与技术研究所,英国ST4 7QB斯托肯特郡哈特谢尔Thornburrow Drive
希瑟·阿姆林·马德森
2葛兰素史克研发有限公司分子发现研究计算生物学部,地址:1250 South Collegeville Road,Collegeville,PA 19426,美国
迪利普·拉贾戈帕兰
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
西蒙·D·托普
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
当地警官库玛尔
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
迈克尔·沃德
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
马克·D·西蒙斯
4葛兰素史克研发有限公司分子发现研究信息技术,地址:美国宾夕法尼亚州科勒维尔南科勒维尔路1250号,邮编:19426
史蒂芬·M·福特
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
菲利普·桑索
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
杨紫恒
1英国伦敦WC1E 6BT高尔街达尔文大厦伦敦大学学院生物系
乔安娜·D·霍尔布鲁克
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
1英国伦敦WC1E 6BT高尔街达尔文大厦伦敦大学学院生物系
2计算生物学部,分子发现研究,葛兰素史克研发有限公司,1250 South Collegeville Road,Collegevelle,PA 19426,USA
三基尔大学医学科学与技术研究所,英国ST4 7QB斯托肯特郡哈特谢尔Thornburrow Drive
4葛兰素史克研发有限公司分子发现研究信息技术,地址:美国宾夕法尼亚州科勒维尔南科勒维尔路1250号,邮编:19426
通讯作者。 收稿日期:2008年5月23日;2008年10月6日接受。
版权©2008 Vamathevan等人;持牌人BioMed Central Ltd。 - 补充资料
附加文件1每个谱系中正选择基因的名称。七个谱系中每一个正向选择基因的Entrez基因名称。
GUID:42E90AFA-46AF-4059-AB59-E978F6FBFDF9
附加文件2其他分析结果的描述。对正文中为确认结果而进行的其他工作进行了描述和讨论。
GUID:93E80DA6-D161-4289-87F5-6A1ECE80EDCB
附加文件3沿着原始人和murid谱系的PSG聚集形成参与炎症过程的网络。积极选择的原始人和murid基因的网络图,它们相互作用并参与炎症功能。
制导:92A3C75E-6A96-4F95-A5FD-522C69F66D46
附加文件4分类单元排除研究结果摘要。在一个或多个排列研究中重要基因的圆形表示。
GUID:097B517E-BE70-426F-BC19-907487198D24
摘要
背景
相关物种,如人类和黑猩猩,经常会经历同样的疾病,病理程度不同,如阿尔茨海默病,或艾滋病的不同症状。此外,由于与生活方式无关的原因,某些疾病如精神分裂症、上皮癌和自身免疫性疾病在人类中的发病率远高于其他物种。在物种进化过程中经历了正向选择的基因表明了导致物种差异的功能性适应。因此,我们研究了物种间的生物医学疾病差异是否可以归因于正选择的基因。
结果
我们确定了在人类和四种常用于模拟人类疾病的哺乳动物(小鼠、大鼠、黑猩猩和狗)的进化过程中可能经历正选择的基因。我们发现,预测在人类进化过程中受到正选择压力的基因与上皮癌、精神分裂症、自身免疫性疾病和阿尔茨海默病等疾病有关,所有这些疾病在人类及其哺乳动物亲属之间的发病率和症状都不同。
与之前的研究一致,我们发现黑猩猩谱系比其他谱系具有更多的正选择基因。此外,我们发现了新的证据来支持这样一种假设,即经历了正向选择的基因往往会相互作用。这是第一个在哺乳动物基因中广泛检测到的此类证据,可能对确定导致物种差异的分子途径很重要。
结论
我们的基因数据集预测在五个物种中进行了正向选择,这是一个信息资源,可以在药物靶点验证期间选择合适的动物模型之前进行参考。我们的结论是,研究物种间功能性疾病和生物医学疾病差异的演变是深入了解其分子原因的重要途径,并可能提供一种方法来预测动物模型何时不符合人类生物学。
背景
许多科学和医学进步都依赖于将模型生物的实验结果外推到人类身上。然而,即使是关系密切的物种,如人类和黑猩猩,也经常会经历同样的疾病,症状不同,如阿尔茨海默病或艾滋病,或发病率不同,如自身免疫性疾病、上皮癌和精神分裂症[1,2].
由于现代人类的生活方式与人类早期进化的条件相去甚远,可能揭示出人类早期历史上不明显的疾病易感性,因此跨物种疾病流行率和症状学的比较变得复杂[三]. 然而,观察到的人类和其他动物之间的生物医学差异不能完全用生活方式来解释[1,2].
遗传病可以作为适应性的副产品发生,适应性具有很大的选择性优势[4]. 例如,精神分裂症这一看似人类特有的疾病[5]与灵长类动物相比,人类更容易患阿尔茨海默病[6]可能是人类对更高认知功能的专业化的副产品[7]. 除了阿尔茨海默病和精神分裂症,人类和其他哺乳动物之间的许多其他疾病在频率和症状上也存在差异。奥尔森和瓦尔基[1]瓦基和阿尔特海德[2]列出其中一些疾病,重点放在非人类灵长类动物身上,表明尽管黑猩猩与人类有着密切的进化关系,但它们并不是这些疾病的好模型。自人类和其他灵长类动物分化以来,一直处于适应性进化中的基因可能参与了这种表型变异,并且是了解疾病状态的关键。因此,比较进化基因组学可以通过将物种进化过程中产生的分子差异与物种间疾病的表型差异联系起来,为这些疾病机制提供见解;从而阐明致病基因和途径。
人类基因组和转录组信息与其他物种的直接比较揭示了导致物种差异的三种主要类型的分子遗传变化。最明显的模式是不同物种中是否存在基因,包括基因复制和基因失活。人们对人类特有或在人类谱系中丢失的基因给予了极大的关注[1,2,8,9]. 然而,与其他物种相比,这些可能代表了人类基因组差异的“冰山一角”。第二类分子遗传改变由核苷酸替换构成,可能导致蛋白质编码和非编码RNA的功能改变。第三类分子变化包括物种间基因表达水平的变化和调节基因表达的机制的变化[8,10].
在这项研究中,我们研究了第二种类型的分子差异,并重点研究了编码同源基因的蛋白质的编码变化。估计70%至80%的同源蛋白质序列在人类和黑猩猩之间是不同的[8,9,11]. 然而,很大一部分差异可能对人类特定疾病没有功能影响。正选择分析可以确定哪些核苷酸变化导致物种之间的生物差异。这是基于这样一个前提,即进化过程中同源基因中正选择压力的作用通常与基因的亚功能化或新功能化有关[12]. 因此,在人类谱系中确定这些基因是一种合理且有希望的方法,可以揭示与人类特定疾病相关的分子变化。
与之前的研究相比[13-17]这项研究的重点是人类进化,其目的是确定在人类和动物模型中经历适应性进化的基因。我们分析了来自人类、黑猩猩、小鼠、大鼠和狗的3079个同源基因的比对,以检测阳性选择信号。选择这些物种是因为它们是医学研究中常见的人类疾病模型,并且可以获得高质量的基因组序列。
我们对最初的数据集进行了积极筛选,以消除同源比对、虚假注释、一个或多个物种中的假基因以及较差的外显子预测。因此,在我们的阳性选择分析中,只使用了我们可以高置信度指定正畸的五组。由于这种严格的筛选,必须注意的是,我们的直系亲属数据集可能包含对高度保守直系亲属的偏见,从而低估了正选择基因的数量,低估了平均差异水平。选择的方向和强度由ω,非同义与同义替代率之比(d日N个/d日秒=ω),使用ω<1、=1和>1分别表示净化选择、中性进化和正向选择。分支模型,用于测试影响预先指定血统上少数位点的正向选择[18-20]用于测试所有现存和祖先血统是否存在阳性选择证据。分支模型已被证明比在给定谱系或站点子集上测试阳性选择的方法更强大、更保守[19]. 我们确定了在哺乳动物进化过程中预计会改变功能的基因,并将我们的发现与已知疾病联系起来,这些疾病显示了人类和模型生物之间的生物医学差异。这些基因可能是物种间表型疾病差异的原因,并有望成为治疗干预的靶点。这种方法对药物开发很有意义,因为检测药物靶点或疾病途径成员中的阳性选择可能会导致动物模型无法预测人类生物学,并解释物种之间观察到的一些生物医学差异[21].
我们发现,黑猩猩谱系中正选择基因的数量比其他谱系中的任何一个都多,是人类谱系中基因数量的三倍。我们提出证据,反驳这种结果可能是由于基因组序列覆盖、基因样本选择或算法对序列数据或比对中错误的敏感性所引入的人工制品。相反,我们得出的结论是,黑猩猩正选择基因数量的增加是进化史的真实反映,很可能是由于正选择在黑猩猩过去的大规模种群中更有效,或者可能是黑猩猩谱系中的显著适应。
如酵母-蛋白质相互作用网络所示,进化速率被认为与蛋白质连接性相关[22-24]. 因此,与中性进化或负选择的基因相比,正选择的基因通常被认为不那么混杂,也就是说,它们与更少的基因相互作用。这可能是因为混杂基因由于在生物途径中的关键或多重作用而受到功能限制。然而,其他分析相同数据的人声称,结果并不确定[25,26]. 我们研究了与非正选择基因相比,适应性进化基因是否与更少的基因相互作用,但没有发现显著差异。然而,我们还研究了一个假设,即在适应性进化下的基因会驱动编码相互作用蛋白的基因的互补性差异。这种相互作用基因的共同进化最常见的例子是受体-受体对,它们共同进化以维持或提高结合亲和力和/或特异性。这类基因的例子包括催乳素(PRL公司)基因及其受体(催乳素受体,PRLR公司)在哺乳动物中[27]与MHC I类分子共同进化的灵长类杀伤细胞免疫球蛋白样受体[28]以及红色和绿色视觉色素基因[29]. 在这里,我们提出的证据表明,正选择基因比在中性进化或纯化选择下进化的基因更有可能与其他正选择基因相互作用。
结果
阳性选择下的基因检测
经过多假设检验校正(见方法),共检测到511个阳性选择基因(PSG)。所有测试的血统都显示出显著性(第页<0.05)正选择下基因进化的证据,从人类谱系的54个基因到黑猩猩谱系的162个基因不等(表). 附加文件中提供了在每个谱系中检测到的PSG的完整列表1.
表1
七个谱系中阳性选择基因的数量和OMIM中阳性基因的数量
血统 | n个 | 米 | 第页价值 |
---|
人类 | 54 | 8 | 0.5919 |
黑猩猩 | 162 | 26 | 0.4190 |
人类 | 56 | 13 | 0.0753 |
鼠标 | 65 | 11 | 0.4032 |
老鼠 | 89 | 18 | 0.1242 |
穆里德 | 81 | 21 | 0.0087* |
狗 | 97 | 21 | 0.0577 |
全部 | 511 | 99 | 0.0067* |
为了全面了解我们数据集中基因的进化速率,在每次比对时都运行codeml程序中的自由比率模型(参见方法)。中位数ω每个谱系的值从小鼠和大鼠的0.14到人类的0.17和黑猩猩的0.20不等(图). 我们对人类的价值观与ω黑猩猩测序和分析协会公布的值[9](小鼠0.142,大鼠0.137,人类0.208,黑猩猩0.194),但与恒河猴基因组测序和分析协会的结果更为相似[30](人类0.169,黑猩猩0.175,小鼠0.104),这表明用于选择输入基因集的严格标准没有对高ω人类和黑猩猩的价值观。在人类和黑猩猩中观察到的较高中值表明原始人类的净化选择减少。
具有分支特异性的五种树ω比率.中位数ω自由比率模型估计了3079个基因对人类、黑猩猩、小鼠、大鼠和狗的进化速率。
有几个基因在多个谱系中显示出选择的特征。我们在人类和黑猩猩谱系中发现了17个PSG,在小鼠和大鼠谱系中都发现了8个PSG以及在原始人和鼠谱系上发现了8种PSG。这些数字远远大于我们的偶然预期(例如,人类和黑猩猩血统中正选择的基因比偶然预期的要多;第页<6.864e-10,Fisher检验;参见附加文件2,表). 血统间重叠基因的详细分析可以在附加文件中找到2、“相邻谱系中选择的基因”和附加文件三.
在黑猩猩血统中检测到阳性选择基因的数量增加
我们在黑猩猩谱系中发现了162个PSG,比人类谱系中检测到的54个PSG多出三倍。这一发现与其他关于黑猩猩进化过程中大量正选择基因的报道一致[16,31]. 贝克韦尔等. [16](使用与本研究完全不同的方法)从13888个基因的初始数据集中鉴定出21个阳性黑猩猩基因和2个阳性人类基因。Arbiza也发现黑猩猩谱系中PSG数量增加等. [31]一种更为相似的方法,在人类基因组和黑猩猩基因组中分别鉴定出1.12%和5.96%的正选择基因,这与这里获得的1.75%(人类)和5.26%(黑猩猩)的结果非常接近。
受积极选择影响的功能过程
使用单侧二项式检验来测试每个谱系的PSG在PANTHER本体数据库的生物过程(BP)类中是否过度表示[32]. 然后将富集程度最高的术语分为BP系列(图)如PANTHER分类系统所定义[33]. 为PSG丰富了属于14个BP家族的32个BP本体术语(第页<0.05,二项检验)。多重校正后,四个BP术语在第页< 0.05. 灵长类谱系中PSG最具代表性的本体论是核酸代谢、神经元活动、免疫和防御。灵长类PSG在发育过程或信号转导等功能类别中也表现出富集,这可能与物种差异有关。鼠系PSG在功能类别免疫、防御和信号转导中表现出过度表达。相当高比例的黑猩猩PSG具有未定义或未知的生物功能(参见附加文件2“黑猩猩PSG的功能分类”)。
PSG过度表示生物过程本体.过度表示PSG的生物过程本体术语(第页< 0.05). 本体术语按功能蛋白PANTHER生物过程家族分类。
OMIM富含阳性选择基因
为了确定我们的PSG数据集是否显著增强了疾病基因,我们检查了OMIM,人类在线孟德尔遗传数据库中定义的与人类疾病相关的基因[34]. 在我们分析中使用的3079个基因中,469个基因(15.2%)与OMIM中的疾病术语相关。在所有七个谱系的511个PSG中,99个基因(19.4%)与OMIM中的疾病术语相关(表). 基于二项分布的测试表明,PSG与疾病之间存在显著联系(第页= 0.0067). 而鼠谱系的PSG在OMIM中明显过多(第页=0.0087),人类、黑猩猩或原始人类谱系的PSG没有表现出任何过度代表性(显著性截止值第页= 0.05).
PSG与人类最近的选择无相关性
我们没有看到任何证据表明基因在人类种群和哺乳动物物种中被积极选择之间存在关系。事实上,似乎有一种趋势表明,如果基因在近代人类历史中处于选择状态,那么沿着原始人分支进行正向选择的可能性较小。将人类PSG的数量与人类群体中正选择压力下的基因进行比较[35]. 这一点很明显,与人类分支的正向选择基因比例(1.8%)相比,近期正向选择和人类分支正向选择的基因比例更低(0.03%)。
所有血统上的PSG都显示出共同进化的证据
为了测试PSG或由PSG编码的蛋白质与非阳性选择基因相比是否与较少的基因或蛋白质相互作用,我们查询了生物相互作用的元数据库(参见方法[36])带有所有PSG的列表。对于所有谱系中的511个PSG,155个(30%)没有与任何其他蛋白质发生任何注释性相互作用,相互作用的中位数为5。对于测试集中没有阳性选择证据的2568个基因,783个(31%)没有任何交互作用物,交互作用物的中位数也为5。因此,与测试集中没有阳性选择的基因相比,PSG的交互作用物中位数并不低(第页= 0.815; 双尾Wilcoxon秩和检验),这表明交互因子的数量不是PSG的决定因素。
为了确定是否有任何PSG相互作用并形成较小的自适应子网络簇,我们使用每个谱系的PSG列表查询同一数据库。来自除人类血统外的所有血统的PSG形成集群。例如,在162只黑猩猩的PSG中,发现了9个簇,由2个3基因簇和7个2基因簇组成。我们应用排列测试来确定形成的簇的数量和大小是否超出了预期。对于黑猩猩和原始人谱系中的PSG,最小两个集群(黑猩猩集群8)的大小(PEX12、PEX19)和9(NRP1、MSI1)和原始人类星团3(DRD2、TH)和4(伊特加夫,AZGP1))偶然超出了预期(第页<0.05)(表)而在狗的血统中,第三组(包含基因SNTA1、DAG1和马斯克)因此,有一些证据表明,PSG可能相互作用并形成自适应子网络。
表2
集群 数 | 基因 集群中 | 第页集群大小的值 给定以前的簇 | 第页给定群集的值 每个基因的相互作用数** |
---|
黑猩猩 | | | |
1 | PCSK5、BMP4、PHOX2A | 0.981 | 0.0013 |
2 | LHB、OTX1、JUB | 0.391 | 0.0001 |
三 | XPC、RAD23A | 0.519 | 0.0035 |
4 | NUCB1、PTGS1 | 0.346 | 0.0046 |
5 | ITGB6,ALOX12 | 0.227 | 0.0030 |
6 | MYO18A,贸易 | 0.131 | 0.0028 |
7 | GSTP1、MAP2K4 | 0.075 | 0.0442 |
8 | PEX12、PEX19 | 0.036* | 0.0003 |
9 | NRP1、MSI1 | 0.019* | 0.0008 |
狗 | | | |
1 | CFP、TAL1、SERPINB1、MMP12、PRF1、BCL2、HRG、ITGA5、COMP | 0.385 | < 0.0001 |
2 | CD79A、HCLS1、LCP2 | 0.209 | 0.0012 |
三 | SNTA1、DAG1、MUSK | 0.036* | 0.0002 |
4 | LRP5、SLC2A2 | 0.171 | 0.0026 |
5 | ALB、MCAM | 0.082 | 0.0123 |
人类 | | | |
1 | CCL19、CD86、MADCAM1 | 0.335 | 0.0015 |
2 | MRC2,第4列 | 0.186 | 0.0028 |
三 | DRD2、TH | 0.045* | 0.0488 |
4 | 伊特加夫,AZGP1 | 0.008* | 0.0080 |
鼠标 | | | |
1 | HLA-DRB1、HLA-DQA2 | 0.755 | 0.0123 |
2 | C1R、C1QA | 0.288 | 0.0030 |
穆里德 | | | |
1 | TLR5、CD86、PTGIR | 0.678 | 0.0001 |
2 | SCNN1G、SPTA1、HECW1 | 0.432 | 0.0021 |
三 | CNR1,强奸f1 | 0.190 | 0.0110 |
4 | 第5层,GP1BA | 0.064 | 0.0032 |
老鼠 | | | |
1 | CDKN2D、TRIM21、CDKN1B、CAST、ICAM1、CFD、ITGB2、C3 | 0.360 | < 0.0001 |
2 | KCNA4、ACTN2、PIK3R5 | 0.526 | 0.0016 |
三 | PIM1、RP9 | 0.280 | 0.0063 |
4 | ASPH、HDAC4 | 0.118 | 0.0053 |
我们还测试了每个簇,以确定在给定簇中每个单独基因的交互作用物数量的情况下,簇的大小是否超出了预期。所有28个集群均被发现具有显著性(第页<0.05(通过排列测试)(表)因此,存在着PSG与其他PSG相互作用的显著现象。为了证实这一观察结果,对与β2整合素基因相互作用的基因进行了进一步分析(ITGB2标准)显示了大鼠的正向选择证据(第页<0.001)和murid(第页<0.05)谱系。已知的四种相互作用的α亚单位中的三种[37]在murid分支上也显示出阳性选择(ITGAL公司,第页< 0.01;ITGAX公司,第页<0.05)或在鼠标分支上(ITGAD公司,第页< 0.001).
讨论
本研究中富含PSG的功能类别与先前基因组扫描中检测到的功能类别密切相关[38]. 鉴于每项研究中使用的不同技术以及大规模研究中固有的假阳性风险,这一共识令人信服。值得注意的是,在所分析的五个物种中,具有不同功能的蛋白质家族可以被确定为每个物种在正向选择下进化。这些基因中的分子变化可能是导致物种特异性差异的原因。
黑猩猩谱系中大量PSG的假设
黑猩猩谱系中大量的PSG不能用正确调用直系亲属或排列质量来解释,因为我们在直系亲属调用过程中使用了保守过滤器,并手动检查了所有PSG排列。我们还检查了黑猩猩PSG的潜在基因组质量值,在预测为阳性选择的位点中,只有1个序列的质量值小于Q20(错误率为0.01),因此PSG的高数量不是由于基因组序列质量差。然而,我们承认黑猩猩基因组序列是未完成的,将包含错误和罕见的多态性,例如它偶尔与mRNA和基因预测序列(例如RefSeq提供的序列)不匹配。在这项研究中,我们试图通过优先使用有效的基因序列(如果可用)和高质量的基因组序列(如果没有)来最小化序列错误的影响。然而,我们不能排除序列错误是我们结果中的一个因素。因此,我们还检查了分类单元采样不会影响其他谱系上PSG的数量,因此确保了一个物种的质量问题不会影响其他谱系上积极选择的信号(见附加文件2“Taxon采样不影响阳性选择的检测”和附加文件4). 此外,将11种极为不同的黑猩猩序列与其他灵长类动物(狨猴、猕猴和猩猩)的同源序列进行比较(见附加文件2“黑猩猩PSG具有谱系特异性”)表明,11种黑猩猩序列中观察到的氨基酸差异是黑猩猩特有的,其他灵长类序列与人类序列具有相同的状态。
黑猩猩谱系中PSG数量高的一个可能解释是,所测序的单个黑猩猩中报告的多态性高(杂合率为9.5×10-4[9]). 这一比率略高于西非黑猩猩(8.0×10-4[9])其多样性水平与人类相似[39]. 种群规模是另一个可能的解释,因为正选择对人类的影响可能比对黑猩猩的影响小,因为黑猩猩的长期种群规模比人类大,这表明黑猩猩序列中核苷酸多样性减少,多态性增加[40].
与哺乳动物之间生物医学差异疾病相关的PSG
总的来说,我们观察到,在OMIM中发现的基因中,PSG过度表达。然而与克拉克的发现相反等. [14],在OMIM中未发现人类谱系的PSG表现出任何过度表达。然而,我们的发现与其他最近的研究一致,这些研究没有发现显著的相关性[9]或只是边缘关联[16]人类PSG和人类疾病之间的关系。OMIM数据库是现有疾病相关基因最完整的免费来源,但确实包括与非病理性疾病相关的基因,如头发颜色;因此,在统计测试中,来自这些数据的噪声可能会导致无意义的结果。在更精确的疾病基因集合中富集PSG的测试可能会产生不同的结果。
对人类和人类谱系中的单个PSG进行检测,发现了与疾病相关的基因,这些基因显示了哺乳动物之间的生物医学差异。下面我们将说明在我们的研究中发现的一些人类和人类PSG是如何与描述为比猿类在人类中更普遍或更严重的疾病相关的[1,2].
上皮癌
人类上皮癌被认为是现代人类20%以上死亡的原因,而在非人类灵长类动物中,这一比例低至2-4%[41]. 虽然这可能部分归因于现代人类生活方式中的致癌因素和预期寿命的差异,但有许多有趣的证据表明,另一个压倒性因素是人类中存在易感基因[8,42-47].
在这里检测到的人类谱系PSG中,许多基因与上皮癌的发生有关:
•MC1R(最大持续功率)(黑素皮质素-1受体)调节黑素细胞中合成的黑色素的数量和类型。该基因的突变与黑色素瘤有关[48]. 该基因的一个等位基因与苍白肤色和红色头发相关,最近被定位在尼安德特人序列中[49]这表明该基因在人类进化中也处于最近的选择阶段。人体的功能变化MC1R(最大持续功率)导致皮肤颜色改变的基因可能会导致对紫外线辐射的敏感性增加,从而导致人类黑色素瘤水平升高。
•G蛋白偶联受体EDNRB公司(内皮素B型受体)及其生理配体内皮素3被认为在黑素细胞和其他神经嵴谱系的发育中起着关键作用[50].EDNRB公司促进黑素细胞前体的早期扩张和迁移并延迟其分化。EDNRB公司在正常黑素细胞转化为黑色素瘤细胞的过程中,其显著增强,在黑色素瘤的相关分化丧失中发挥作用[51].
•存在ALPPL2型基因产物是一种碱性磷酸酶同工酶,已被证明能增加有丝分裂前雄性生殖细胞的恶性转化潜能。在肿瘤进展过程中,该基因的启动子活性增加。ALPPL2型现已确认为睾丸生殖细胞肿瘤的标志物[52].
•GIPC2号机组mRNAs在来源于弥漫型胃癌的细胞中表达,并且在一些原发性胃癌中表达增加[53]. 的PDZ域GIPC2号机组蛋白质与参与调节生长因子信号和细胞粘附的几个基因相互作用(例如。FZD3型,IGF-1型和NTRK1)。因此GIPC2号机组可能在致癌和胚胎发生中起关键作用。
在原始人谱系中,一些PSG也与上皮癌的发展有关,这表明原始人与其他哺乳动物之间的癌症发病过程存在差异:
•MSH2型是一个DNA错配基因,被确定为种系突变导致遗传性非息肉病性结肠癌(HNPCC)的常见基因座[54]. 由于任何DNA修复基因的缺陷都可能增加癌症风险,因此这组基因对研究癌症流行率的物种差异很感兴趣。我们发现,参与DNA修复和核苷酸代谢的基因分别在黑猩猩和人类谱系中的PSG中过度表达(图). 以前也有报道称,PSG在核苷酸代谢类别中富集[38].
•ABCC11公司与正常组织相比,[ABC-结合盒,C亚家族,成员11]基因产物在乳腺癌中高表达。ABCC11型受ERα调节,ERα介导雌激素对乳腺癌的促瘤作用[55].
共济失调和偏头痛
钙通道基因,CACNA1A公司被发现在人类血统中处于正选择状态。在人类中CACNA1A公司与脊髓小脑共济失调6型和发作性共济失调2型等通道病相关[56]以及更常见的疾病,如家族性偏瘫偏头痛、肌张力障碍、癫痫、肌无力甚至间歇性昏迷[57]. 贩运或信号调制CACNA1A公司由于中枢神经系统的适应能力不同,人类和其他哺乳动物之间存在差异,这可能导致人类更容易患上这些神经疾病。增强CNS兴奋性的好处可能超过严重头痛和残疾的风险,即偏头痛的症状[58]. 它也可能是大脑中设计约束的假象,这是由较老和最近进化的大脑结构之间的不完美互连造成的[4].
阿尔茨海默病
阿尔茨海默病相关基因[59,60],APOE公司,在原始人谱系中处于正选择状态。功能更改的选择APOE公司人类谱系中的基因可能与其在神经发育或脂质代谢中的作用有关。在本研究中发现的八种正选择氨基酸中,四种存在于脂结合羧基末端。
人类和其他哺乳动物在阿尔茨海默病方面存在物种差异的说法来自于缺乏病理损伤,包括老年黑猩猩大脑中观察到的与人类阿尔茨海默氏病相关的神经纤维缠结[6,61]或者大象[62]. 此外,呈现β-淀粉样神经病的阿尔茨海默病转基因小鼠模型在人类首次出现淀粉样斑块时没有表现出认知能力下降[63]. 最后,有趣的是,除人类以外的哺乳动物似乎只有一种等位基因形式APOE公司,E4等位基因[60,64],人类中的相同形式使携带者易患阿尔茨海默病的风险更高[65].
我们假设正选择压力作用于APOE公司在人类进化过程中APOE公司在神经发育方面,可能与认知能力的扩展相一致。然而,其他研究表明,与认知相关的主要进化事件发生得更早[66]. 认知能力增强可能会增加痴呆症(如阿尔茨海默病)的易感性[67]但由于这些疾病的发病时间已过了生育年龄,自然选择会忽视这些疾病。另一种可能性是饮食压力影响了APOE公司在哺乳动物中,物种适应不同脂肪水平的饮食,因此有利于不同形式的APOE[68].
精神分裂症
神经学研究表明,精神分裂症患者大脑中差异失调的区域也受到人类血统中最进化的变化的影响[69]. 人类谱系中的许多PSG与精神分裂症相关:
•基因中的SNPPIK3C2G系列[磷酸肌醇-3-激酶]最近被证明与精神分裂症有关[70]. 该基因与磷脂酰肌醇途径有关,因此可能是精神分裂症和双相情感障碍的候选基因[71].
•慢性精神分裂症的另一候选基因是Q399等位基因XRCC1公司蛋白质,在碱基切除修复中起作用[72]. 精神分裂症的病理生理学与细胞凋亡敏感性增加有关。中的突变XRCC1公司可能会导致DNA损伤,如果检测到,会导致凋亡调节器阻止细胞周期进展。
其他认知障碍
基因也是沿着人类血统进行正向选择的GFRA3型是青蒿素受体和胶质细胞系衍生神经营养因子(GDNF)配体家族成员。该基因作为一种信号因子调节许多交感神经细胞群的发育和维持[73]. 特别是,与其他GDNF家族成员一起,青蒿素在突触可塑性中发挥作用,突触可塑性被认为是记忆的中枢机制[74]. 在GFRA3公司预计会导致认知障碍,使其成为认知障碍的候选基因。
自身免疫疾病
自身免疫疾病在非人类灵长类动物中罕见,而在人类中相对常见[41].欧洲标准化委员会-B是在整个细胞周期中存在于着丝粒异染色质中的三种着丝粒DNA结合蛋白之一。这些蛋白的自身抗体常见于自身免疫性疾病患者,如局限性系统性硬化、系统性红斑狼疮和类风湿性关节炎[75]. 在人类进化过程中作用于该基因的正选择压力与实验结果一致,即欧洲标准化委员会-B是物种特有的[76].
调节基因的正向选择
编码序列上的选择事件也可能对基因表达调控产生影响。一种转录因子在人类谱系中表现出阳性选择的迹象是HIVEP3公司(免疫缺陷病毒I型增强子结合蛋白3)。该基因属于锌指蛋白家族,其功能包括通过结合HIV-1长末端重复序列的NF-kappaB基序激活HIV基因表达[77]. 众所周知,黑猩猩中的HIV感染并没有发展到人类艾滋病中的医学复杂程度[41]. 在黑猩猩体内,该病毒与免疫系统保持良性关系,而在人类体内,它感染并破坏辅助性T细胞。转录因子的功能变化,如HIVEP3公司人类和黑猩猩之间的差异可以解释HIV疾病进展的观察差异。
基因表达的调控元件也显示出沿着人类血统的正向选择证据。一个是移动10基因(Moloney白血病病毒10,同源),一种RNA解旋酶,与60S核糖体亚单位的蛋白质一起包含在多蛋白复合体中。MOV10型与人类RISC(RNA诱导沉默复合物)有关[78]. RNA沉默或干扰(RNAi)最近被描述为在转录水平调节基因表达或沉默致病基因的重要治疗应用[79,80]. 中的任何功能更改移动10由于选择而产生的基因可能会影响多个基因的转录控制,从而导致物种之间的广泛差异。
结论
我们的结论是,比较进化基因组学对哺乳动物疾病的研究有着重要的贡献,可以进一步识别候选基因体内调查。研究人员传统上认为人类和模型生物之间的生物医学差异是进步的障碍。然而,我们认为这些差异也为剖析疾病的分子原因提供了机会。为了利用这个机会,我们需要强大的计算进化算法(如本研究中使用的算法)和一种稳健的方法来利用不断扩展的基因组序列数据。这种方法固有的两个主要挑战是:首先,序列错误可能会增加识别阳性选择压力病例的假阳性率,其次,要充分利用这些信息,需要详细说明目前稀少物种之间疾病发生和症状的生理差异。
了解疾病基因的进化史也可以显著影响药物发现过程中临床前动物模型的选择[81]. 制药管道的成功率仍然很低,其中一个原因是很难将安全性和有效性研究从动物模型成功转化为人类。临床前研究假设实验物种和人类的药物靶点在功能上是等效的,但情况并非总是如此[38]. 特别是,神经退行性疾病的动物模型在人类中缺乏预测有效性[82]. 研究基因进化过程中的选择压力可以为药物靶点验证的动物模型选择提供有价值的信息。我们对五种哺乳动物的PSG结果作为信息资源,可在制药行业药物靶点验证期间选择合适的动物模型之前进行参考。
积极的选择压力不仅会一次作用于一个基因,还会作用于基因的通路。我们发现,在同一谱系中受到正选择的基因比不受正选择影响的基因更有可能相互作用,这是基因共同进化在哺乳动物中普遍存在的第一个证据。我们认为,当蛋白质因选择而发生变化时,蛋白质的相互作用伙伴发生代偿性变化,从而导致PSG之间的高度连接性。
我们观察到,在类人猿祖先的进化过程中,许多黑猩猩基因受到了正向选择。由于医学研究和绝大多数生物学研究都集中于发现更多关于人类生物学的信息,我们对黑猩猩特有的特征了解得更少。黑猩猩血统中PSG的数量表明,这些黑猩猩的适应能力至少与我们大肆吹嘘的人类特性一样引人注目。
方法
序列数据
我们分析了所有Entrez人类基因(于2006年9月访问),这些基因被注释为蛋白质编码,并具有确认的mRNA序列。与每个基因相关的最长开放阅读框包含在起始集中。从GenBank(2006年9月访问)中提取了RefSeq NCBI数据库中的固化mRNA序列以及四种模型生物(黑猩猩、小鼠、大鼠和狗)和鸡(外群)的基因组序列。
正统呼叫
正交检测管道使用相互tBlastX搜索[83]在人类和模型生物序列数据库之间。如果得分最高的非人类物种序列是基因组序列,表明该物种中该基因的mRNA序列不可用,则通过GeneWise进行处理[84]以人类肽为模板,鉴定预测的基因结构并去除内含子。然后将得到的cDNA序列用作对人类数据库进行双向tBlastX搜索的查询。得分最高的mRNA序列被提交给tBlastX反向搜索,没有修改。
人类基因和模型生物基因之间的相互最佳匹配标记为该人类转录查询的同源对,条件是第页人类mRNA序列与模型生物数据库的最佳匹配值高于第页倒数步骤的最佳命中值。
不完整的基因组测序也会导致直系亲属呼叫错误。在这种情况下,作为调用直系词的一种方法,往复爆破是无效的,因为缺少真正的直系词会导致更具分歧的副直系词成为最热门的。为了解决这个问题,我们添加了一个截止线,它要求第页该物种的假定同源基因值小于该基因的鸡同源基因值。之所以选择鸡,是因为它是与哺乳动物最近的亲缘动物,因为在足够的覆盖范围内可以获得完整的基因组草图序列[85]. 对于262个没有鸡亲缘关系的人类基因,仅对反向BLAST预测的基因进行了分析,但这些基因被标记为潜在问题。
检测受阳性选择影响的基因
使用Muscle翻译并对齐5个同源序列的结果集[86],然后转换为相应的核苷酸比对。然后,针对模型生物相对于人类的序列中的移码,对所有比对进行校正。使用标准哺乳动物物种树创建每个路线的无根树文件[87]((人类、黑猩猩)、(老鼠、老鼠)、狗)(图). 最初,使用PAML包的codeml程序中实现的M0(单比率)模型分析数据集[88]. M0模型假设为常数ω树中所有分支和基因中所有密码子位点的比率[89]. 在每条路线上进行两次M0模型运行,以检查对数似然值,κ两次运行中的分支长度一致。重新运行不一致的运行,直到值聚合。在随后使用分支模型进行的分析中,分支长度和转换/转换速率比κ固定在M0模型下的估计值。随着待估计参数数量的减少,该策略减少了计算时间。
为了推断基因的谱系特异性进化,分支模型[18,19]用于阳性选择测试。我们测试了七个分支中的每一个分支的物种系统发育,并将其作为前景分支依次处理。多假设校正之前的结果不应用于后续分析,因为家庭错误率高得令人无法接受[90]. 在这里,我们报告了多次测试的Bonferroni校正后的结果,该校正被认为是保守的,因此,阳性选择的预测特别稳健。这种严格方法的必然结果是可能产生假阴性。选择性分枝模型有四个密码子位点类别,前两个用于所有谱系的纯化选择和中性选择进化位点,另外两个用于前景分枝的正选择位点。空模型限制前台谱系上的站点进行中性进化。每个分支模型至少运行三次,以确保对数似然值在0.001或0.001以内收敛。未与其他运行收敛的运行表明数据存在问题,并报告为此类问题。
数据处理
当仔细检查来自自动程序的数据时,注意到一些比对区域存在不明确比对或序列不显示为同源的区域。由于基因组序列中的缺口或缺失或变异外显子,导致基因预测不完整可能导致非正形学领域。因此,对数据进行了进一步的手动更正,详情如下:
1.为了纠正低相似度区域,对所有比对进行扫描,以屏蔽序列中超过3个连续密码子与比对中其他序列不同的部分,以及这些密码子两侧有一个或两侧间隙的部分。也包含相对于人类序列的帧移位的序列被纠正。
2.在整个数据集上重新运行PAML后,我们手动检查了所有重要结果的比对(第页< 0.05). 如果属于正选择谱系的基因序列发生移码或排列不明确,则放弃该结果。
交互数据分析
使用由蛋白质相互作用(如结合和磷酸化、转录控制和翻译后修饰)组成的网络来搜索正选择下的基因是否相互作用。网络中的交互数据是由包括Ingenuity在内的多家商业供应商授权的[91],喜气洋洋[92]、基因GO[93]、NetPro[94]和HPRD[95]. 这些数据库中的所有信息都基于文献的人工管理。此外,从PRIME数据库许可的高质量、自动提取的交互[96]与转录调控相关的相互作用是从TransFac许可的实验验证蛋白-DNA结合关系中获得的[97]和TRRD[98]数据库。特定基因的DNA、RNA和蛋白质之间没有区别,这三者都表示为网络中的单个节点。对产生生物子网络的基因列表进行搜索,并按[36].
作者的贡献
JJV参与了系统发育分析、数据分析和质量控制,并帮助起草了手稿。SH为数据QC编写脚本,并帮助起草手稿。RDE构思了这项研究,参与了系统发育分析并帮助起草了手稿。HAM构思了这项研究,参与了正交调用管道的设计、数据质量控制策略和结果分析,并审阅了手稿。DR设计并参与了共同进化实验。SDT设计并参与了数据收集和正交调用管道。VK设计了正交调用管道。MW为数据收集编写脚本。MDS编写了数据收集脚本。SMF帮助起草了手稿。PS帮助起草了手稿。ZY参与了系统发育分析、数据分析并帮助起草了手稿。JDH构思了这项研究,参与了系统发育分析、数据分析和共同进化实验,并帮助起草了手稿。
补充材料
附加文件1:每个谱系中正选择基因的名称。七个谱系中每一个正向选择基因的Entrez基因名称。
附加文件2:其他分析结果的描述。对正文中为确认结果而进行的其他工作进行了描述和讨论。
附加文件3:沿着原始人和murid谱系的PSG聚集形成参与炎症过程的网络。积极选择的原始人和murid基因的网络图,它们相互作用并参与炎症功能。
附加文件4:分类单元排除研究结果摘要。在一个或多个排列研究中重要基因的圆形表示。
致谢
我们要感谢Fabrizio Caldara在疾病本体论方面的帮助,感谢Roberto Alvarez在序列数据库方面的帮助。我们还感谢三位匿名审稿人,他们提出了全面而富有建设性的意见,帮助我们改进了手稿。这项研究得到了生物技术和生物科学研究委员会(BBSRC)对ZY的资助,以及MRC对RDE的生物信息学奖学金的支持。
工具书类
- Olson MV,Varki A.黑猩猩基因组测序:人类进化和疾病的见解。自然资源部Genet。2003;4(1):20–28. doi:10.1038/nrg981。[公共医学] [交叉参考][谷歌学者]
- Varki A,Altheide TK。人类和黑猩猩基因组的比较:在干草堆中寻找针头。基因组研究。2005;15(12):1746–1758. doi:10.1101/gr.3737405。[公共医学] [交叉参考][谷歌学者]
- Young JH、Chang YP、Kim JD、Chretien JP、Klag MJ、Levine MA、Ruff CB、Wang NY、Chakravarti A.对高血压的不同易感性是由于在非洲扩张期间的选择。公共科学图书馆-遗传学。2005;1(6) :e82。doi:10.1371/journal.pgen.0010082。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Nesse RM,Williams GC。我们生病的原因:达尔文医学的新科学。纽约:泰晤士报;1995[谷歌学者]
- Crespi B,Summers K,Dorus S.精神分裂症潜在基因的适应性进化。过程生物科学。2007;274(1627):2801–2810. doi:10.1098/rspb.2007.0876。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Gearing M、Rebeck GW、Hyman BT、Tigges J、Mirra SS。老年黑猩猩的神经病理学和载脂蛋白E谱:对阿尔茨海默病的影响。美国国家科学院程序。1994;91(20):9382–9386. doi:10.1073/pnas.91.20.9382。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Keller MC,Miller G.解决常见的、有害的、可遗传的精神障碍悖论:哪种进化遗传模型最有效?行为脑科学。2006;29(4):385–404.讨论405-352。[公共医学][谷歌学者]
- 库珀DN Kehrer-Sawatzki H。了解人类基因组的最新进化:从人类黑猩猩基因组比较中获得的见解。哼,变种。2007;28(2):99–130. doi:10.1002/humu.20420。[公共医学] [交叉参考][谷歌学者]
- 黑猩猩SaAC。黑猩猩基因组的初始序列以及与人类基因组的比较。自然。2005;437(7055):69–87. doi:10.1038/nature04072。[公共医学] [交叉参考][谷歌学者]
- Gilad Y,Oshlack A,Smyth GK,Speed TP,White KP。灵长类的表达谱揭示了人类转录因子的快速进化。自然。2006;440(7081):242–245. doi:10.1038/nature04559。[公共医学] [交叉参考][谷歌学者]
- Glazko G、Veeramachaneni V、Nei M、Makalowski W。80%的蛋白质在人类和黑猩猩之间是不同的。基因。2005;346:215–219. doi:10.1016/j.gene.2004.11.003。[公共医学] [交叉参考][谷歌学者]
- 杨志。系统发育比较在揭示蛋白质功能方面的力量。美国国家科学院。2005;102(9):3179–3180. doi:10.1073/pnas.0500371102。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Smith NG,Eyre-Walker A.人类疾病基因:模式和预测。基因。2003;318:169–175. doi:10.1016/S0378-1119(03)00772-8。[公共医学] [交叉参考][谷歌学者]
- Clark AG、Glanowski S、Nielsen R、Thomas PD、Kejariwal A、Todd MA、Tanenbaum DM、Civello D、Lu F、Murphy B.等人。从人-鼠同源基因三联体推断非中性进化。科学。2003;302(5652):1960–1963. doi:10.1126/science.1088721。[公共医学] [交叉参考][谷歌学者]
- Huang H,Winter EE,Wang H,Weinstock KG,Xing H,Goodstadt L,Stenson PD,Cooper DN,Smith D,Alba MM等。大鼠和小鼠基因组中人类疾病基因同源基因的进化保护和选择。基因组生物学。2004;5(7) :R47。doi:10.1186/gb-2004-5-7-r47。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Bakewell MA,Shi P,Zhang J.黑猩猩进化中经历正选择的基因比人类进化中更多。美国国家科学院。2007;104(18):7489–7494. doi:10.1073/pnas.0701705104。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Bustamante CD、Fledel-Alon A、Williamson S、Nielsen R、Hubisz MT、Glanowski S、Tanenbaum DM、White TJ、Sninsky JJ、Hernandez RD等。人类基因组中蛋白质编码基因的自然选择。自然。2005;437(7062):1153–1157. doi:10.1038/nature04240。[公共医学] [交叉参考][谷歌学者]
- Yang Z,Nielsen R.检测特定世系个体位点分子适应的密码子替代模型。分子生物学进化。2002;19(6):908–917.[公共医学][谷歌学者]
- 张杰,尼尔森R,杨忠。分子水平上检测阳性选择的改进分支位点似然法评估。分子生物学进化。2005;22(11):1–8.[公共医学][谷歌学者]
- Yang Z,Wong WS,Nielsen R.Bayes正选择下氨基酸位点的经验Bayes推断。分子生物学进化。2005;22(4):1107–1118. doi:10.1093/molbev/msi097。[公共医学] [交叉参考][谷歌学者]
- Vamathevan J,Holbrook JD,Emes路。生命科学百科全书。John Wiley&Sons有限公司;2007.老鼠基因组作为进化研究中的啮齿动物模型。[谷歌学者]
- Fraser HB,Hirsh AE,Steinmetz LM,Scharfe C,Feldman MW。蛋白质相互作用网络中的进化速率。科学。2002;296(5568):750–752. doi:10.1126/science.1068696。[公共医学] [交叉参考][谷歌学者]
- Fraser HB,Wall DP,Hirsh AE。蛋白质进化速率和蛋白质相互作用数量之间的简单依赖性。BMC进化生物学。2003;三:11.doi:10.1186/1471-2148-3-11。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Fraser HB,Hirsh AE。进化速率取决于独立于基因表达水平的蛋白质相互作用的数量。BMC进化生物学。2004;4:13.doi:10.1186/1471-2148-4-13。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Bloom JD,Adami C.蛋白质进化速率对相互作用数量的明显依赖性与蛋白质相互作用数据集中的偏差有关。BMC进化生物学。2003;三:21.doi:10.186/1471-2148-3-21。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Jordan IK、Wolf YI、Koonin EV。蛋白质进化速率与蛋白质相互作用的数量之间没有简单的依赖关系:只有最多产的相互作用物倾向于缓慢进化。BMC进化生物学。2003;三:1.数字对象标识代码:10.1186/1471-2148-3-1。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Li Y、Wallis M、Zhang YP。哺乳动物泌乳素受体基因的阶段性进化:与其配体的共同进化。《分子内分泌杂志》。2005;35(3):411–419. doi:10.1677/jme.1.01798。[公共医学] [交叉参考][谷歌学者]
- Hao L,Nei M.灵长类杀伤细胞免疫球蛋白样受体基因的快速扩增及其与MHC I类基因的共同进化。基因。2005;347(2):149–159. doi:10.1016/j.gene.2004.12.012。[公共医学] [交叉参考][谷歌学者]
- Deeb SS、Jorgensen AL、Battisti L、Iwasaki L、Motulsky AG。类人猿和人类红色和绿色视觉色素的序列差异。美国国家科学院程序。1994;91(15):7262–7266. doi:10.1073/pnas.91.15.7262。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Gibbs RA、Rogers J、Katze MG、Bumgarner R、Weinstock GM、Mardis ER、Remington KA、Strausberg RL、Venter JC、Wilson RK等。恒河猴基因组的进化和生物医学见解。科学。2007;316(5822):222–234. doi:10.1126/science.1139247。[公共医学] [交叉参考][谷歌学者]
- Arbiza L、Dopazo J、Dopazzo H。人类和黑猩猩基因组进化中的正向选择、松弛和加速。公共科学图书馆计算生物学。2006;2(4) :e38。doi:10.1371/journal.pcbi.0020038。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Thomas PD、Kejariwal A、Campbell MJ、Mi H、Diemer K、Guo N、Ladunga I、Ulitsky-Lazareva B、Muruganujan A、Rabkin S.等人。PANTHER:一个按生物功能组织的可浏览的基因产品数据库,使用策划的蛋白家族和亚家族分类。核酸研究。2003;31(1):334–341. doi:10.1093/nar/gkg115。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Thomas PD、Campbell MJ、Kejariwal A、Mi H、Karlak B、Daverman R、Diemer K、Muruganujan A、Narechania A.PANTHER:按功能索引的蛋白质家族和亚家族库。基因组研究。2003;13(9):2129–2141. doi:10.1101/gr.772403。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- 在线孟德尔遗传在人类,OMIM(TM)网址:http://www.ncbi.nlm.nih.gov/omim[公共医学]
- Tang K,Thornton KR,Stonking M.使用基因组扫描检测人类基因组中最近阳性选择的新方法。《公共科学图书馆·生物》。2007;5(7) :e171。doi:10.1371/journal.pbio.0050171。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Rajagopalan D,Agarwal P.使用生物关系的文献衍生网络从基因列表推断路径。生物信息学。2005;21(6):788–793. doi:10.1093/bioinformatics/bti069。[公共医学] [交叉参考][谷歌学者]
- Ewan R、Huxley-Jones J、Mould AP、Humphries MJ、Robertson DL、Boot-Handford RP。肠道尾索动物的整合素为脊椎动物整合素家族的分子进化提供了新的见解。BMC进化生物学。2005;5(1):31. doi:10.1186/1471-2148-5-31。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Holbrook JD,Sanseau P.药物发现和计算进化分析。今日毒品发现。2007;12(19–20):826–832. doi:10.1016/j.drudis.2007.08.015。[公共医学] [交叉参考][谷歌学者]
- Sachidanandam R、Weissman D、Schmidt SC、Kakol JM、Stein LD、Marth G、Sherry S、Mullikin JC、Mortimore BJ、Willey DL。等。包含142万个单核苷酸多态性的人类基因组序列变异图。自然。2001;409(6822):928–933. doi:10.1038/35057149。[公共医学] [交叉参考][谷歌学者]
- Kaessmann H、Wiebe V、Weiss G、Paabo S。大猩猩DNA序列揭示了人类多样性的减少和扩展。自然遗传学。2001;27(2):155–156. doi:10.1038/84773。[公共医学] [交叉参考][谷歌学者]
- Varki A.黑猩猩基因组计划是生物医学的当务之急。基因组研究。2000;10(8):1065–1070. doi:10.1101/gr.10.8.1065。[公共医学] [交叉参考][谷歌学者]
- Beniashvili DS。非人类灵长类自发性肿瘤的世界文献综述。医学杂志Primatol。1989;18(6):423–437.[公共医学][谷歌学者]
- 非人类灵长类动物的肿瘤:在耶基斯灵长类中心群体的六年观察。Am J Phys人类学杂志。1973;38(2):425–429. doi:10.1002/ajpa.1330380243。[公共医学] [交叉参考][谷歌学者]
- Seibold HR,Wolf RH。1065例非人灵长类动物尸检中的肿瘤和增生性病变。实验室动画科学。1973;23(4):533–539.[公共医学][谷歌学者]
- Coggins CR。实验动物香烟烟雾吸入研究的最新综述。国际毒理学杂志。2007;26(4):331–338. doi:10.1080/10915810701490190。[公共医学] [交叉参考][谷歌学者]
- Puente XS、Velasco G、Gutierrez-Fernatez A、Bertranpetit J、King MC、Lopez-Otin C。人类和黑猩猩基因组中癌症基因的比较分析。BMC基因组学。2006;7:15.doi:10.1186/1471-2164-7-15。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Crespi BJ,Summers K。癌症进化中的正选择。生物Rev Camb Philos Soc。2006;81(3):407–424. doi:10.1017/S1464793106007056。[公共医学] [交叉参考][谷歌学者]
- Valverde P、Healy E、Sikkink S、Haldane F、Thody AJ、Carothers A、Jackson IJ、Rees JL。黑素皮质素1受体(MC1R)的Asp84Glu变体与黑色素瘤相关。人类分子遗传学。1996;5(10):1663–1666. doi:10.1093/hmg/5.10.1663。[公共医学] [交叉参考][谷歌学者]
- Lalueza-Fox C、Rompler H、Caramelli D、Staubert C、Catalano G、Hughes D、Rohland N、Pilli E、Longo L、Condemi S.等人。黑素皮质激素1受体等位基因表明尼安德特人的色素形成不同。科学。2007;318(5855):1453–1455. doi:10.1126/science.1147417。[公共医学] [交叉参考][谷歌学者]
- McCallion AS、Chakravarti A.EDNRB/EDN3和II型先天性巨结肠。色素细胞研究。2001;14(3):161–169. doi:10.1034/j.1600-0749.2001.140305.x。[公共医学] [交叉参考][谷歌学者]
- Lahav R.内皮素受体B是扩张黑素细胞前体和恶性黑色素瘤所必需的。国际开发生物学杂志。2005;49(2–3):173–180. doi:10.1387/ijdb.041951rl。[公共医学] [交叉参考][谷歌学者]
- Tascou S、Nayernia K、Uedelhoven J、Bohm D、Jalal R、Ahmed M、Engel W、Burfeind P。体外分离和鉴定侵袭性和非侵袭性小鼠永生化雄性生殖细胞中差异表达的基因。国际癌症杂志。2001;18(3):567–574.[公共医学][谷歌学者]
- 加藤M.GIPC基因家族(综述)国际分子医学杂志。2002;9(6):585–589.[公共医学][谷歌学者]
- Yoon SN、Ku JL、Shin YK、Kim KH、Choi JS、Jang EJ、Park HC、Kim DW、Kin MA、Kim WH。等。子宫内膜癌患者的遗传性非息肉病性结直肠癌。国际癌症杂志。2008;122(5):1077–1081. doi:10.1002/ijc.22986。[公共医学] [交叉参考][谷歌学者]
- Laganiere J、Deblois G、Lefebvre C、Bataille AR、Robert F、Giguere V。封面:雌激素受体α靶基因启动子的位置分析表明,FOXA1定义了雌激素反应的一个域。美国国家科学院程序。2005;102(33):11651–11656. doi:10.1073/pnas.0505575102。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Jen JC、Graves TD、Hess EJ、Hanna MG、Griggs RC、Baloh RW。原发性发作性共济失调:诊断、发病机制和治疗。大脑。2007;130(第10部分):2484–2493。doi:10.1093/brain/awm126。[公共医学] [交叉参考][谷歌学者]
- Jouvenceau A、Eunson LH、Spauschus A、Ramesh V、Zuberi SM、Kullmann DM、Hanna MG。与大脑P/Q型钙通道功能障碍相关的人类癫痫。柳叶刀。2001;358(9284):801–807. doi:10.1016/S0140-6736(01)05971-2。[公共医学] [交叉参考][谷歌学者]
- Loder E.偏头痛的进化优势是什么?头痛。2002;22(8):624–632. doi:10.1046/j.1468-2982.2002.00437.x。[公共医学] [交叉参考][谷歌学者]
- 载脂蛋白E:胆固醇转运蛋白,在细胞生物学中发挥着越来越大的作用。科学。1988;240(4852):622–630. doi:10.1126/science.3283935。[公共医学] [交叉参考][谷歌学者]
- Hanlon CS,Rubinsztein DC公司。载脂蛋白E基因112和158密码子处的精氨酸残基与人类祖先的状态相对应。动脉粥样硬化。1995;112(1):85–90. doi:10.1016/0021-9150(94)05402-5。[公共医学] [交叉参考][谷歌学者]
- Gearing M、Tigges J、Mori H、Mirra SS。β40是非人类灵长类动物中β淀粉样蛋白的主要形式。神经生物老化。1996;17(6):903–908. doi:10.1016/S0197-4580(96)00164-9。[公共医学] [交叉参考][谷歌学者]
- 科尔·G、尼尔·JW。衰老大象的大脑。神经病理学实验神经学杂志。1990;49(2):190–192. doi:10.1097/00005072-199003000-00012。[公共医学] [交叉参考][谷歌学者]
- Howlett DR、Richardson JC、Austin A、Parsons AA、Bate ST、Davies DC、Gonzalez MI。携带淀粉样前体蛋白和早老素-1突变转基因的雄性和雌性小鼠中阿贝塔沉积的认知相关性。大脑研究。2004;1017(1–2):130–136. doi:10.1016/j.braines.2004.05.029。[公共医学] [交叉参考][谷歌学者]
- Hacia JG、Fan JB、Ryder O、Jin L、Edgemon K、Ghandour G、Mayer RA、Sun B、Xie L、Robbins CM等人。使用高密度寡核苷酸阵列测定人类单核苷酸多态性的祖先等位基因。自然遗传学。1999;22(2):164–167. doi:10.1038/9674。[公共医学] [交叉参考][谷歌学者]
- Strittmatter WJ、Saunders AM、Schmechel D、Pericak-Vance M、Enghild J、Salvesen GS、Roses AD。载脂蛋白E:与β-淀粉样蛋白的高亲和力结合以及晚发型家族性阿尔茨海默病中4型等位基因的频率增加。美国国家科学院程序。1993;90(5):1977–1981. doi:10.1073/pnas.90.5.1977。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Emes RD、Pocklington AJ、Anderson CNG、Bayes A、Collins MAO、Vickers CA、Croning MDR、Malik BR、Choudhary JS、Armstrong JD。突触蛋白质组复杂性的进化扩展和解剖特化。自然神经科学。新闻界。[PMC免费文章][公共医学]
- Chen Q、Nakajima A、Choi SH、Xiong X、Sisodia SS、Tang YP。成人神经发生在功能上与AD样神经变性有关。神经生物学疾病。2008;29(2):316–326. doi:10.1016/j.nbd.2007.09.005。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Finch CE、Morgan TE。全身炎症、感染、ApoE等位基因和阿尔茨海默病:一份立场文件。当前阿尔茨海默病研究。2007;4(2):185–189. doi:10.2174/156720507780362254。[公共医学] [交叉参考][谷歌学者]
- 布鲁纳·M·精神分裂症——进化之谜?神经科学生物学评论。2004;28(1):41–53. doi:10.1016/j.neubior.2003.10.002。[公共医学] [交叉参考][谷歌学者]
- Jungerius BJ、Hoogendoorn ML、Bakker SC、Van’t Slot R、Bardoel AF、Ophoff RA、Wijmenga C、Kahn RS、Sinke RJ。髓磷脂相关基因的关联筛查显示精神分裂症患者的染色体22q11 PIK4CA基因。分子精神病学。2007. [公共医学]
- Stopkova P、Saito T、Papolos DF、Vevera J、Paclt I、Zukov I、Bersson YB、Margolis BA、Strous RD、Lachman HM。与双相情感障碍和精神分裂症相关的PIK3C3启动子变异的鉴定。生物精神病学。2004;55(10):981–988. doi:10.1016/j.biopych.2004.01.014。[公共医学] [交叉参考][谷歌学者]
- Saadat M,Pakyari N,Farrashbandi H。DNA修复基因XRCC1的遗传多态性与精神分裂症易感性。精神病学研究。2008;157(1–3):241–245. doi:10.1016/j.psychres.2007.07.014。[公共医学] [交叉参考][谷歌学者]
- Wang X、Baloh RH、Milbrandt J、Garcia KC。青蒿素与其受体GFRalpha3复合的结构:对胶质细胞系衍生神经营养因子的聚合识别。结构。2006;14(6):1083–1092. doi:10.1016/j.str.2006.05.010。[公共医学] [交叉参考][谷歌学者]
- Kim SJ,Linden DJ。无处不在的可塑性和记忆存储。神经元。2007;56(4):582–592. doi:10.1016/j.neuron.2007.10.30。[公共医学] [交叉参考][谷歌学者]
- Russo K、Hoch S、Dima C、Varga J、Teodorescu M。弥漫性和局限性系统性硬化症、系统性红斑狼疮和类风湿性关节炎患者的循环抗中心粒CENP-A和CENP-B抗体。风湿病学杂志。2000;27(1):142–148.[公共医学][谷歌学者]
- Sugimoto K、Migita H、Hagishita Y、Yata H、Himeno M。人类着丝粒蛋白B(CENP-B)的一种抗原决定簇,可用于在小鼠中产生人类特异性抗着丝粒抗体。细胞结构功能。1992;17(2):129–138.[公共医学][谷歌学者]
- Seeler JS、Muchardt C、Suessle A、Gaynor RB。转录因子PRDII-BF1激活人类免疫缺陷病毒1型基因表达。《维罗尔杂志》。1994;68(2):1002–1009. [PMC免费文章][公共医学][谷歌学者]
- Chendrimada TP、Finn KJ、Ji X、Baillat D、Gregory RI、Liebhaber SA、Pasquinelli AE、Shiekhattar R.通过RISC招募eIF6沉默微RNA。自然。2007;447(7146):823–828. doi:10.1038/nature05841。[公共医学] [交叉参考][谷歌学者]
- Federici T,新墨西哥州布利斯。核糖核酸对神经疾病的干预:候选疾病、潜在靶点和当前方法。神经外科。2007;60(1):3–15. doi:10.1227/01.NEU.000249214.42461.A5。讨论15-16。[公共医学] [交叉参考][谷歌学者]
- Barnes MR、Deharo S、Grocock RJ、Brown JR、Sanseau P。微RNA靶范例:细胞表达的基本和多态性控制层。生物治疗专家。2007;7(9):1387–1399. doi:10.1517/14712598.7.9.1387。[公共医学] [交叉参考][谷歌学者]
- Searls数据库。药物系统发育学:基因、进化和药物靶点。《自然》杂志评论药物发现。2003;2(8):613. doi:10.1038/nrd1152。[公共医学] [交叉参考][谷歌学者]
- Heemskerk J、Tobin AJ、Ravina B。从化学到药物:神经变性药物筛选和临床试验的伦理。自然神经科学。2002;5(补充):1027–1029。doi:10.1038/nn931。[公共医学] [交叉参考][谷歌学者]
- Altschul SF、Gish W、Miller W、Myers EW、Lipman DJ。基本本地对齐搜索工具。分子生物学杂志。1990;215(3):403–410.[公共医学][谷歌学者]
- Birney E、Clamp M、Durbin R.GeneWise和Genomewise。基因组研究。2004;14(5):988–995. doi:10.1101/gr.1865504。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- 联合体ICGS。鸡基因组的序列和比较分析为脊椎动物的进化提供了独特的视角。自然。2004;432(7018):695–716. doi:10.1038/nature03154。[公共医学] [交叉参考][谷歌学者]
- 埃德加钢筋混凝土。肌肉:高精度和高通量的多序列比对。核酸研究。2004;32(5):1792–1797. doi:10.1093/nar/gkh340。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Murphy WJ、Eizirik E、O'Brien SJ、Madsen O、Scally M、Douady CJ、Teeling E、Ryder OA、Stanhope MJ、de Jong WW。等。使用贝叶斯系统发育学解决早期胎盘哺乳动物辐射问题。科学。2001;294(5550):2348–2351. doi:10.1126/science.1067179。[公共医学] [交叉参考][谷歌学者]
- Yang Z.PAML:最大似然系统发育分析程序包。计算应用生物科学。1997;13:555–556.[公共医学][谷歌学者]
- 杨忠。检测阳性选择的似然比试验及其在灵长类溶菌酶进化中的应用。分子生物学进化。1998;15(5):568–573.[公共医学][谷歌学者]
- Anisimova M,Yang Z.多假设检验在仅影响少数地点的正选择下检测世系。分子生物学进化。2007;24(5):1219–1228. doi:10.1093/molbev/msm042。[公共医学] [交叉参考][谷歌学者]
- Ingenuity Systems公司。网址:http://www.intenuity.com
- 兴高采烈的生物系统。http://www.jubilantbiosys.com
- GeneGo公司。网址:http://www.genego.com
- NetPro。http://www.molecularconnections.com
- 人类蛋白质参考数据库。http://www.hprd.org
- Koike A,Takagi T.PRIME:自动提取蛋白相互作用和分子信息数据库。硅生物。2005;5(1):9–20.[公共医学][谷歌学者]
- Matys V、Fricke E、Geffers R、Gossling E、Haubrock M、Hehl R、Hornischer K、Karas D、Kel AE、Kel-Margoulis OV。等。TRANSFAC:从模式到剖面的转录调控。核酸研究。2003;31(1):374–378. doi:10.1093/nar/gkg108。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Kolchanov NA、Ignatieva EV、Ananko EA、Podkolodnaya OA、Stepanenko IL、Merkulova TI、Pozdnyakov MA、Podkolodny NL、Naumochkin AN、Romashchenko AG。转录调控区数据库(TRRD):2002年状况。核酸研究。2002;30(1):312–317. doi:10.1093/nar/30.1.312。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]