跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
科学。作者手稿;可在PMC 2006年12月14日获得。
以最终编辑形式发布为:
2004年1月2日在线发布。 数字对象标识:10.1126/科学1091403
预防性维修识别码:项目经理1698949
NIHMSID公司:美国国立卫生研究院11367
PMID:14704431

后生动物相互作用网络图秀丽线虫

关联数据

补充资料

摘要

为了启动蛋白质相互作用(或“相互作用组”)网络如何与多细胞功能相关的研究,我们绘制了秀丽隐杆线虫相互作用组网络。从后生动物特异蛋白的一个子集开始,在高通量酵母双杂交(HT=Y2H)筛选中鉴定出4000多个相互作用。独立的凝聚纯化分析通过实验验证了该Y2H数据集的总体质量。连同已经描述的Y2H相互作用和预测的中断生物信息学,当前版本的Worm Interactome(WI5)映射包含约5500个交互。这个相互作用组网络的拓扑和生物学特征,以及它与现象组和转录组数据集的集成,导致了许多生物学假设。

为了进一步了解生物过程,在复杂分子网络的背景下考虑蛋白质功能是很重要的。对这类网络的研究需要蛋白质组-蛋白质相互作用或“相互作用组”地图的可用性。酵母酿酒酵母已用于开发真核生物单细胞相互作用组图谱(1-6).秀丽隐杆线虫是研究蛋白质网络与多细胞性关系的理想模型。这里我们研究它与HT-Y2H的相互作用网络。

作为Y2H毒饵,我们选择了一组3024个与多细胞功能直接或间接相关的蠕虫预测蛋白(7). 秀丽线虫ORFeome 1.1型(8)1978年这些选定的蛋白质。其中81台自动启动Y2HGAL1::HIS3报告基因为Gal4 DNA结合域融合(DB-X),其他24个基因对酵母细胞具有毒性。剩余的1873个诱饵针对两个不同的Gal4激活结构域文库(AD-wrmcDNA和AD-ORFeome1.0)进行筛选,每个文库都具有不同但互补的优势(7).

通过应用严格的实验和生物信息学标准(图S1),我们最大限度地提高了Y2H系统的特异性。为了消除由非特异性启动子激活引起的相互作用,我们只考虑DB-X-AD-Y对,如果它们激活了三个不同Gal4-responsive启动子中的至少两个。随后在新鲜酵母细胞中重新检测阳性,并通过对相应的聚合酶链反应(PCR)产物进行测序获得的相互作用序列标签(ISTs)来确定其AD-Y身份(9). 对每个IST验证AD-Y阅读框,以避免框架外肽的恢复。总共获得了约16000个IST。

应用这些标准后,我们将相互作用细分为三个置信类(图S1):那些独立发现至少三次且AD-Y结位于框架中的相互作用(“Core-1”,858相互作用);帧中的那些发现少于三次并且通过了重新测试(“Core-2”,1299次交互);以及屏幕中发现的所有其他Y2H交互(“非核心”,1892交互)。核心数据集(核心1和核心2)包含502个DB-X诱饵和1039个AD-Y猎物之间的2157个高置信交互作用。在折叠DB-X-AD-Y和DB-Y-AD-X配置中发生的22个相互作用后,共获得2135个独特的相互作用(表S1)。非核心数据集包含531个DB-X诱饵和1395个AD-Y猎物之间的1892个相互作用。总的来说,核心和非核心构成了“First-Pass”数据集,共有4027个不同的交互。在分别与AD-wrmcDNA和AD-ORFeome1.0发现的2783和1505个相互作用中,共有239个相互作用与这两个文库进行了鉴定。

为了估计HT-Y2H数据集的覆盖范围,我们手动搜索此处筛选的诱饵,以查找WormPD中已知的交互物(10). 该搜索产生了108个交互作用,称为“文献”数据集(表S1)。核心数据集和非核心数据集分别概述了该基准数据集中的八个和两个交互作用。因此,我们的首次通过数据集的总覆盖率为~10%[(8+2)/108)]。

为了评估HT-Y2H数据集的准确性,我们推断在两种不同的结合分析中检测到的相互作用不太可能是实验假阳性。从这三个亚群中的每一个亚群随机选择Y2H相互作用对的代表性样品(33个核心-1,62个核心-2,48个非核心),并在凝聚纯化(co-AP)谷胱甘肽中进行测试S公司-转移酶(GST)下拉分析(图1). 诱饵和猎物ORF分别瞬时转染293T细胞作为GST-诱饵和Myc-preey融合物。对于两种蛋白质均以可检测水平表达的潜在相互作用对,核心-1的共AP成功率为17分之14(82%),核心-2的共AP成功率为29分之17(59%),非核心的共AP成功率为23分之8(35%)(表S2)。这些数据表明,我们的三个数据集包含大量高度可靠的交互作用,并证实了它们的预期相对质量。

保存图片、插图等的外部文件。对象名称为nihms-11367-0001.jpg

煤质净化分析。所示为Core-1、Core-2和Non-Core数据集的10个示例。顶部面板显示了谷胱甘肽-脑葡萄糖亲和纯化后Myc-tagged猎物的表达,证明与GST诱饵结合。中间和底部面板分别显示Myc-preey和GST-bait的表达。在表达GST-诱饵蛋白(+)的提取物和仅表达GST的提取物(-)之间交替排列。ORF对在表S1中标识为与它们在表中出现的顺序相对应的车道号。

除了实验屏幕,我们还执行了生物信息学寻找潜在的保守相互作用或“interolog”,已知其同源对在一个或多个其他物种中相互作用(9,11). 从高置信度酵母相互作用数据集开始(7),相互最热门的BLAST搜索(E类-值≤10-6)针对蠕虫预测的蛋白质组进行。总共识别了949个潜在的蠕虫互操作日志,构成了互操作日志数据集(7). 此外,Y2H相互作用组图是以前为单个生物过程(包括外阴发育、蛋白质降解、DNA损伤反应和生殖系形成)生成的(9,12-14)被合并以定义“脚手架”数据集。HT-Y2H、文献、interologs和scaffold数据集被合并到Worm Interactome version 5(WI5)中,包含5534个交互,连接15%的秀丽线虫蛋白质组(表S1)。WI5产生了一个由5460个边缘连接的2898个节点组成的庞大网络组件(图2A). 类似于其他生物网络(15)蠕虫相互作用网络具有小世界和无标度特性(图2B) (7). 这个数据集还允许我们分析进化中的近期蛋白质是否倾向于优先相互作用,而不是与古代蛋白质相互作用。我们将网络的节点分为三类:748个蛋白质在酵母中具有清晰的直系同源性(“古代”),1314个蛋白质在果蝇、拟南芥,或人类,但不在酵母中(“多细胞”),以及836种蛋白质,在酵母外没有可检测的直系物秀丽线虫(“蠕虫”)(7). 这三组人似乎彼此联系得很好(图2C)这表明新的细胞功能依赖于进化上新的和古老的元素的结合,这与进化论的经典主张是一致的,进化论是一个修补器,可以修改和添加预先存在的结构来创造新的结构(16).

保存图片、插图等的外部文件。对象名称为nihms-11367-0002.jpg

分析WI5网络(A类)节点(代表蛋白质)的颜色根据其系统发育类别而定:古节点(红色)、多细胞节点(黄色)和蠕虫节点(蓝色)。边缘代表蛋白质相互作用。插图突出显示了网络的一小部分(B类)蛋白质比例,P(k个),有不同数量的互动伙伴,k个,显示为秀丽线虫用作诱饵或猎物的蛋白质酿酒酵母蛋白质。(C类)饼图显示了Y2H屏幕上每个系统发育类别中相互作用的猎物的比例。还显示了AD-ORFeome1.0库中找到的所有猎物和搜索到的所有猎品的分布。(D类)与转录组重叠(见正文)(18)计算并绘制相互作用数据集及其相应随机数据集中每对蛋白质的皮尔逊相关系数(PCCs)。右侧的红色区域对应于显示与表达式分析数据有显著关系的交互(P(P)< 0.05). (E类)托波马山29中蛋白质之间的相互作用(18). 这些短划线蛋白属于同一个同源家族(同源性超过80%),因此被分解成一组相互作用。(F类)两个基因都是胚胎致死基因的相互作用对的比例(P(P)< 10-7).

以前的研究将相互作用组数据与全基因组表达(转录组)和表型分析(现象组)数据相关联酿酒酵母(17). 为了研究不同功能基因组分析在多细胞生物背景下的相关性,我们将WI5与秀丽线虫转录组和现象组数据集。

基于秀丽线虫转录组概要数据集(18),我们计算了参与Y2H相互作用的基因对的皮尔逊相关系数(PCCs),并将其与随机数据集进行了比较(图2D). 大约150个核心相互作用(9.5%)对应于PCCs显著高于随机预期的基因对(P(P)<0.05)(表S3)。因此,这些配对可以被认为“在生物学上更有可能”,因为两种完全独立的方法指出了相应基因之间的功能关系。其余的配对标记为“无其他证据”。事实上,重要的是要注意,缺乏共表达并不意味着相应的相互作用是无关的。事实上,75%的被定义为生物学相关的文献对与转录组数据无关(图2D).

我们还系统地研究了Y2H相互作用,其中这两种蛋白质属于共同的秀丽线虫表达式簇或“Topomap山脉”(18). 例如,来自29号山的高度连接子网(图2E)包含七个共享公共域(DUF139域和富含半胱氨酸重复序列)的蛋白质(ABU-1、ABU-8、ABU-11、PQN-5、PQN-54、PQN-57和PQN-71)。此外,这些蛋白都在咽部表达(19-21)这表明它们可能在咽部功能或发育中共同作用。

对于相对较小的酿酒酵母秀丽线虫相互作用数据集,物理相互作用指的是基因敲除或敲除时具有相似表型的基因(17). 为了评估这个想法秀丽线虫相互作用组,我们根据来自WormBase的RNA干扰(RNAi)敲除实验收集了一组表型数据(7,22),我们计算了相互作用数据集及其随机对照中共享胚胎致死表型的蛋白质相互作用对的百分比,并发现核心数据集和第一通过数据集的双重富集(图2F). 母体不育表型和四组胚胎后表型也观察到类似的相关性(23). 由于两个基因在多种条件下共存并在敲除时表现出相似表型的蛋白质相互作用特别可能,因此上述全球相关性说明了如何从重叠相互作用组、转录组、,和现象数据集(表S3)。

酿酒酵母,两种具有许多共同作用伙伴的蛋白质更有可能在生物学上相关(24). 我们检查了秀丽线虫通过确定网络中蛋白质之间的相互聚集系数,相互作用组网络存在高度连接的邻域(表S4)(24). 例如,我们检查了包含这样一个高得分蛋白质对的簇之一的属性:VAB-3/C49A1.4(图3). VAB-3和C49A1.4与果蝇属基因无眼的()和眼睛缺失(艾娅),但不是彼此。EY和EYA是调节眼睛发育的转录因子保守网络的组成部分(25).

保存图片、插图等的外部文件。对象名称为nihms-11367-0003.jpg

VAB-3和C49A1.4周围高度互联子网的图形表示。生物功能类别从WormPD获得(10).

VAB-3和C49A1.4是WI5中高度互联子网的一部分(图3)已知或怀疑在功能上与VAB-3和C49A1.4或其在其他生物体中各自的同源物相关的蛋白质。其中包括(i)EGL-27,它对雌雄同体中的MAB-5起负调节作用(26)并通过C49A1.4与MAB-5相连;(ii)WRT-2,C49A1.4的相互作用体,与果蝇属刺猬,可以缓解艾娅表达式Cubitus interruptus公司(27); 和(iii)CEH-33和CEH-35眼正弦同源异型盒基因家族果蝇属转录因子as的调控网络艾娅(28). 最后,该簇中的八个蛋白质在WormPD中被注释为与膜功能有关,这表明了在无眼的转录网络和膜活性。

Y2H数据集与interology和先前描述的相互作用一起,为细胞中数千个无特征的蛋白质提供了功能假设秀丽线虫蛋白质组。与其他功能基因组数据的整合表明,转录组和相互作用组数据之间的相关性虽然显著,但低于在酵母中观察到的预期值(17). 此观察结果既适用于此处描述的Y2H数据集,也适用于来自文献衍生数据集的特征鲜明的蠕虫交互(图2D). 这可能是因为,与单细胞生物不同,后生动物的生物过程可能在生物体内、不同器官、组织或单个细胞中以不同的方式发生,这使其变得复杂。

我们当前的相互作用组图还说明了人类相互作用组项目如何从使用重组克隆系统(如Gateway)的ORFeome克隆项目中受益(8). 事实上,重组克隆的ORF可以随意转换为不同类型蛋白质相互作用分析所需的各种表达载体,例如我们能够将诱饵和预编码ORF转换为Myc和GST标记的载体以验证Y2H相互作用。

补充材料

补充材料

单击此处查看。(419K,pdf)

参考文献和注释

1Marcotte EM等人。科学。1999;285:751.[公共医学][谷歌学者]
2Pellegrini M、Marcotte EM、Thompson MJ、Eisenberg D、Yeates TO。程序。国家。阿卡德。科学。美国。1999;96:4285. [PMC免费文章][公共医学][谷歌学者]
三。Uetz P等人。自然。2000;403:623.[公共医学][谷歌学者]
4Ito T等人。程序。国家。阿卡德。科学。美国。2001;98:4569. [PMC免费文章][公共医学][谷歌学者]
5Ho Y等人。自然。2002;415:180.[公共医学][谷歌学者]
6Gavin AC等人。自然。2002;415:141.[公共医学][谷歌学者]
7科学。请参阅网上的支持材料。[谷歌学者]
8Reboul J等人。自然遗传学。2003;34:35.[公共医学][谷歌学者]
9Walhout AJM、Sordella R、Lu X、Hartley JL。科学。2000;287:116.[公共医学][谷歌学者]
10Costanzo MC等人。核酸研究。2001;29:75. [PMC免费文章][公共医学][谷歌学者]
11Matthews LR等人。基因组研究。2001;11:2120. [PMC免费文章][公共医学][谷歌学者]
12Davy A等人。EMBO代表。2001;2:821. [PMC免费文章][公共医学][谷歌学者]
13Boulton SJ等人。科学。2002;295:127.[公共医学][谷歌学者]
14Walhout AJM等人。货币。生物。2002;12:1952.[公共医学][谷歌学者]
15斯特罗加茨SH。自然。2001;410:268.[公共医学][谷歌学者]
16雅各布·F·。科学。1977;196:1161.[公共医学][谷歌学者]
17Ge H、Walhout AJM、Vidal M。趋势Genet。2003;19:551.[公共医学][谷歌学者]
18Kim SK等人。科学。2001;293:2087.[公共医学][谷歌学者]
19.Gaudet J,芒果东南部。科学。2002;295:821.[公共医学][谷歌学者]
20.Hanazawa M、Mochii M、Ueno N、Kohara Y、Iino Y。程序。国家。阿卡德。科学。美国。2001;98:8686. [PMC免费文章][公共医学][谷歌学者]
21Urano F等人。《细胞生物学杂志》。2002;158:639. [PMC免费文章][公共医学][谷歌学者]
22.Stein L、Sternberg P、Durbin R、Thierry-Mieg J、Spieth J。核酸研究。2001;29:82. [PMC免费文章][公共医学][谷歌学者]
23.Ge H.未发表的观察结果。
24Goldberg DS,Roth FP公司。程序。国家。阿卡德。科学。美国。2003;100:4372. [PMC免费文章][公共医学][谷歌学者]
25Wawersik S,Maas RL公司。嗯,分子遗传学。2000;9:917.[公共医学][谷歌学者]
26Ch’ng Q,Kenyon C。发展。1999;126:3303.[公共医学][谷歌学者]
27Pappu KS等人。发展。2003;130:3053.[公共医学][谷歌学者]
28Dozier C、鹿儿岛H、Niklaus G、Cassata G、Burglin TR。开发生物。2001;236:289.[公共医学][谷歌学者]
29我们感谢M.V.实验室成员的投入和帮助;C.Boone、G.Achaz和D.Allinger进行讨论;Agencourt Biosciences测序人员提供技术援助;ORFeome会议参与者的意见;C.McCowan、T.Clingingsmith和C.You寻求行政协助;和C.Fraughton负责实验室支持。这项工作得到了NHGRI和NIGMS向M.V.颁发的赠款的支持。其他支持包括NSF奖(K.C.G.);NIGMS拨款(S.v.d.H.、S.E.M.、J.W.H.);国防部博士前研究金(B.B.);由国家癌症控制协会颁发的奖项(C.S.,A.C.);HHMI机构拨款(F.P.R.,G.F.B);以及EMBO(P.-O.V.)、NSF(D.S.G)、Ryan、Milton(S.L.W.)、Fu(L.V.Z.)和白血病研究基金会(M.E.)的奖学金