科学。作者手稿;可在PMC 2006年12月14日获得。
以最终编辑形式发布为:
预防性维修识别码:项目经理1698949
NIHMSID公司:美国国立卫生研究院11367
后生动物相互作用网络图秀丽线虫
,1,* ,1,* ,1,* ,1,* ,1,* ,1,* ,1,* ,1,* ,1,2,* ,1 ,三 ,1 ,1 ,1,4 ,1,4 ,5,† ,1 ,三 ,三 ,三 ,1,‡ ,1,‡ ,1,§ ,1 ,1 ,1 ,1,‖ ,5 ,6 ,7 ,8 ,8 ,9 ,10 ,6 ,6 ,11 ,12 ,4 ,2 ,7 ,8 ,12 ,5,† ,1 ,三 ,1,¶和1,¶#
李思明
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
克里斯托弗·阿姆斯特朗
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
尼古拉斯·伯廷
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
慧阁
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
斯图亚特·米尔斯坦
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
迈克·博克西姆
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
皮尔雷·奥利维尔·维达拉因
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
韩静栋
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
阿尔班·切斯诺
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
2法国蒙彼利埃-塞德克斯5号门德大道1919年5535号国家科学研究中心摩尔库莱尔研究所。
童浩
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
黛布拉·S·戈德堡
三哈佛医学院生物化学和分子药理学系,美国马萨诸塞州波士顿龙伍德大道250号,邮编02115。
李宁
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
莫妮卡·马丁内斯
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
Jean-François Rual女士
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
4比利时纳穆尔5000号布鲁塞尔街61号巴黎圣母院生物制品研究所。
菲利普·拉梅什
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
4比利时纳穆尔5000号布鲁塞尔街61号巴黎圣母院生物制品研究所。
赖旭
5美国德克萨斯州休斯顿贝勒广场1号贝勒医学院生物化学和分子生物学、生物物理和生物学项目,Verna和Marrs生物化学和生物系。
穆尼什·特瓦里
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
莎莉·王莉(Sharyl L.Wong)
三哈佛医学院生物化学和分子药理学系,美国马萨诸塞州波士顿龙伍德大道250号,邮编02115。
兰·V·张
三哈佛医学院生物化学和分子药理学系,美国马萨诸塞州波士顿龙伍德大道250号,邮编02115。
加布里埃尔·F·贝里兹
三哈佛医学院生物化学和分子药理学系,美国马萨诸塞州波士顿龙伍德大道250号,邮编02115。
劳伦特·雅各托
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
菲利普·瓦格利奥
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
杰罗姆·雷布尔
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
Tomoko Hirozane-Kishikawa先生
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
李倩如
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
哈里森·加贝尔
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
艾哈迈德·埃利瓦
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
布里奇特·鲍姆加特纳
5Verna和Marrs生物化学和分子生物学系,细胞和分子生物学、生物物理学和生物学项目,贝勒医学院,One Baylor Plaza,Houston,TX 77030,USA。
黛布拉·J·罗斯
6印第安纳大学生物系,美国印第安纳州布卢明顿东三街1001号乔丹厅142号,邮编:47405。
于海源
7美国康涅狄格州纽黑文惠特尼大道266号耶鲁大学分子生物物理和生物化学系及计算机科学系,邮编06520。
斯蒂芬妮·博萨克
8Agencourt生物科学公司,100 Cummings Center,Suite 107G,Beverly,MA 01915,USA。
雷纳尔多·塞奎拉
8Agencourt生物科学公司,100 Cummings Center,Suite 107G,Beverly,MA 01915,USA。
安德鲁·弗雷泽
9Wellcome Trust Sanger Institute,Wellcome-Trust Genome Campus,剑桥,CB10 1SA,英国。
苏珊·E·芒果
10犹他大学亨茨曼癌症研究所,2000年希望圈,美国犹他州盐湖城,邮编84112。
威廉·萨克斯顿
6印第安纳大学生物系,Jordan Hall 142,1001 East Third Street,Bloomington,IN 47405,美国。
苏珊·斯特罗姆
6印第安纳大学生物系,美国印第安纳州布卢明顿东三街1001号乔丹厅142号,邮编:47405。
桑德·范登·胡维尔
11美国马萨诸塞州查尔斯顿第13街149号楼马萨诸塞总医院癌症中心,邮编02129。
法比奥钢琴
12纽约大学生物系,美国纽约州纽约市华盛顿广场东100号银大厦1009号,邮编10003。
让·范登豪特
4比利时纳穆尔5000号布鲁塞尔街61号巴黎圣母院生物制品研究所。
克劳德·萨德特
2法国蒙彼利埃塞德克斯5号门德路1919号国家科学研究中心G&nétique Moléculaire研究所UMR 5535。
马克·格斯坦
7美国康涅狄格州纽黑文惠特尼大道266号耶鲁大学分子生物物理和生物化学系和计算机科学系,邮编06520。
林恩·杜塞特-斯塔姆
8Agencourt生物科学公司,100 Cummings Center,Suite 107G,Beverly,MA 01915,USA。
克里斯汀·冈萨卢斯
12纽约大学生物系,美国纽约州纽约市华盛顿广场东100号银大厦1009号,邮编10003。
J.韦德·哈珀
5美国德克萨斯州休斯顿贝勒广场1号贝勒医学院生物化学和分子生物学、生物物理和生物学项目,Verna和Marrs生物化学和生物系。
迈克尔·库西克
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
弗雷德里克·罗斯
三哈佛医学院生物化学和分子药理学系,美国马萨诸塞州波士顿龙伍德大道250号,邮编02115。
大卫·E·希尔
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
马克维达尔
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
1美国马萨诸塞州波士顿宾尼街44号哈佛医学院达纳-法伯癌症研究所和遗传学系,邮编02115。
2法国蒙彼利埃塞德克斯5号门德路1919号国家科学研究中心G&nétique Moléculaire研究所UMR 5535。
三美国马萨诸塞州波士顿朗伍德大道250号哈佛医学院生物化学和分子药理学系,邮编02115。
4比利时纳穆尔5000号布鲁塞尔街61号巴黎圣母院生物制品研究所。
5美国德克萨斯州休斯顿贝勒广场1号贝勒医学院生物化学和分子生物学、生物物理和生物学项目,Verna和Marrs生物化学和生物系。
6印第安纳大学生物系,美国印第安纳州布卢明顿东三街1001号乔丹厅142号,邮编:47405。
7美国康涅狄格州纽黑文惠特尼大道266号耶鲁大学分子生物物理和生物化学系及计算机科学系,邮编06520。
8Agencourt生物科学公司,100 Cummings Center,Suite 107G,Beverly,MA 01915,美国马萨诸塞州。
9Wellcome Trust Sanger Institute,Wellcome-Trust Genome Campus,剑桥,CB10 1SA,英国。
10犹他大学亨茨曼癌症研究所,2000年希望圈,美国犹他州盐湖城,邮编84112。
11美国马萨诸塞州查尔斯顿第13街149号楼马萨诸塞总医院癌症中心,邮编02129。
12纽约大学生物系,美国纽约州纽约市华盛顿广场东100号银大厦1009号,邮编10003。
*这些作者为这项工作做出了同等贡献。
†现住址:美国马萨诸塞州波士顿龙伍德大道200号哈佛医学院病理学系,邮编02115。
‡现住址:法国马赛13009圣玛格丽特大道232号Modul-Bio。
§现住址:INSERM,Unité119,Institute Paoli Calmettes,13009 Marseille,France。
‖现住址:马萨诸塞大学基因功能与表达项目,地址:美国马萨诸塞州北伍斯特湖大道55号,邮编:01605。
¶现住址:美国马萨诸塞州波士顿宾尼街44号达纳-法伯癌症研究所和哈佛医学院遗传学系癌症系统生物学中心和癌症生物学系。
为了进一步了解生物过程,在复杂分子网络的背景下考虑蛋白质功能是很重要的。对这类网络的研究需要蛋白质组-蛋白质相互作用或“相互作用组”地图的可用性。酵母酿酒酵母已用于开发真核生物单细胞相互作用组图谱(1-6).秀丽隐杆线虫是研究蛋白质网络与多细胞性关系的理想模型。这里我们研究它与HT-Y2H的相互作用网络。
作为Y2H毒饵,我们选择了一组3024个与多细胞功能直接或间接相关的蠕虫预测蛋白(7). 在秀丽线虫ORFeome 1.1型(8)1978年这些选定的蛋白质。其中81台自动启动Y2HGAL1::HIS3报告基因为Gal4 DNA结合域融合(DB-X),其他24个基因对酵母细胞具有毒性。剩余的1873个诱饵针对两个不同的Gal4激活结构域文库(AD-wrmcDNA和AD-ORFeome1.0)进行筛选,每个文库都具有不同但互补的优势(7).
通过应用严格的实验和生物信息学标准(图S1),我们最大限度地提高了Y2H系统的特异性。为了消除由非特异性启动子激活引起的相互作用,我们只考虑DB-X-AD-Y对,如果它们激活了三个不同Gal4-responsive启动子中的至少两个。随后在新鲜酵母细胞中重新检测阳性,并通过对相应的聚合酶链反应(PCR)产物进行测序获得的相互作用序列标签(ISTs)来确定其AD-Y身份(9). 对每个IST验证AD-Y阅读框,以避免框架外肽的恢复。总共获得了约16000个IST。
应用这些标准后,我们将相互作用细分为三个置信类(图S1):那些独立发现至少三次且AD-Y结位于框架中的相互作用(“Core-1”,858相互作用);帧中的那些发现少于三次并且通过了重新测试(“Core-2”,1299次交互);以及屏幕中发现的所有其他Y2H交互(“非核心”,1892交互)。核心数据集(核心1和核心2)包含502个DB-X诱饵和1039个AD-Y猎物之间的2157个高置信交互作用。在折叠DB-X-AD-Y和DB-Y-AD-X配置中发生的22个相互作用后,共获得2135个独特的相互作用(表S1)。非核心数据集包含531个DB-X诱饵和1395个AD-Y猎物之间的1892个相互作用。总的来说,核心和非核心构成了“First-Pass”数据集,共有4027个不同的交互。在分别与AD-wrmcDNA和AD-ORFeome1.0发现的2783和1505个相互作用中,共有239个相互作用与这两个文库进行了鉴定。
为了估计HT-Y2H数据集的覆盖范围,我们手动搜索此处筛选的诱饵,以查找WormPD中已知的交互物(10). 该搜索产生了108个交互作用,称为“文献”数据集(表S1)。核心数据集和非核心数据集分别概述了该基准数据集中的八个和两个交互作用。因此,我们的首次通过数据集的总覆盖率为~10%[(8+2)/108)]。
为了评估HT-Y2H数据集的准确性,我们推断在两种不同的结合分析中检测到的相互作用不太可能是实验假阳性。从这三个亚群中的每一个亚群随机选择Y2H相互作用对的代表性样品(33个核心-1,62个核心-2,48个非核心),并在凝聚纯化(co-AP)谷胱甘肽中进行测试S公司-转移酶(GST)下拉分析(). 诱饵和猎物ORF分别瞬时转染293T细胞作为GST-诱饵和Myc-preey融合物。对于两种蛋白质均以可检测水平表达的潜在相互作用对,核心-1的共AP成功率为17分之14(82%),核心-2的共AP成功率为29分之17(59%),非核心的共AP成功率为23分之8(35%)(表S2)。这些数据表明,我们的三个数据集包含大量高度可靠的交互作用,并证实了它们的预期相对质量。
煤质净化分析。所示为Core-1、Core-2和Non-Core数据集的10个示例。顶部面板显示了谷胱甘肽-脑葡萄糖亲和纯化后Myc-tagged猎物的表达,证明与GST诱饵结合。中间和底部面板分别显示Myc-preey和GST-bait的表达。在表达GST-诱饵蛋白(+)的提取物和仅表达GST的提取物(-)之间交替排列。ORF对在表S1中标识为与它们在表中出现的顺序相对应的车道号。
除了实验屏幕,我们还执行了生物信息学寻找潜在的保守相互作用或“interolog”,已知其同源对在一个或多个其他物种中相互作用(9,11). 从高置信度酵母相互作用数据集开始(7),相互最热门的BLAST搜索(E类-值≤10-6)针对蠕虫预测的蛋白质组进行。总共识别了949个潜在的蠕虫互操作日志,构成了互操作日志数据集(7). 此外,Y2H相互作用组图是以前为单个生物过程(包括外阴发育、蛋白质降解、DNA损伤反应和生殖系形成)生成的(9,12-14)被合并以定义“脚手架”数据集。HT-Y2H、文献、interologs和scaffold数据集被合并到Worm Interactome version 5(WI5)中,包含5534个交互,连接15%的秀丽线虫蛋白质组(表S1)。WI5产生了一个由5460个边缘连接的2898个节点组成的庞大网络组件(). 类似于其他生物网络(15)蠕虫相互作用网络具有小世界和无标度特性() (7). 这个数据集还允许我们分析进化中的近期蛋白质是否倾向于优先相互作用,而不是与古代蛋白质相互作用。我们将网络的节点分为三类:748个蛋白质在酵母中具有清晰的直系同源性(“古代”),1314个蛋白质在果蝇、拟南芥,或人类,但不在酵母中(“多细胞”),以及836种蛋白质,在酵母外没有可检测的直系物秀丽线虫(“蠕虫”)(7). 这三组人似乎彼此联系得很好()这表明新的细胞功能依赖于进化上新的和古老的元素的结合,这与进化论的经典主张是一致的,进化论是一个修补器,可以修改和添加预先存在的结构来创造新的结构(16).
分析WI5网络(A类)节点(代表蛋白质)的颜色根据其系统发育类别而定:古节点(红色)、多细胞节点(黄色)和蠕虫节点(蓝色)。边缘代表蛋白质相互作用。插图突出显示了网络的一小部分(B类)蛋白质比例,P(k个),有不同数量的互动伙伴,k个,显示为秀丽线虫用作诱饵或猎物的蛋白质酿酒酵母蛋白质。(C类)饼图显示了Y2H屏幕上每个系统发育类别中相互作用的猎物的比例。还显示了AD-ORFeome1.0库中找到的所有猎物和搜索到的所有猎品的分布。(D类)与转录组重叠(见正文)(18)计算并绘制相互作用数据集及其相应随机数据集中每对蛋白质的皮尔逊相关系数(PCCs)。右侧的红色区域对应于显示与表达式分析数据有显著关系的交互(P(P)< 0.05). (E类)托波马山29中蛋白质之间的相互作用(18). 这些短划线蛋白属于同一个同源家族(同源性超过80%),因此被分解成一组相互作用。(F类)两个基因都是胚胎致死基因的相互作用对的比例(P(P)< 10-7).
以前的研究将相互作用组数据与全基因组表达(转录组)和表型分析(现象组)数据相关联酿酒酵母(17). 为了研究不同功能基因组分析在多细胞生物背景下的相关性,我们将WI5与秀丽线虫转录组和现象组数据集。
基于秀丽线虫转录组概要数据集(18),我们计算了参与Y2H相互作用的基因对的皮尔逊相关系数(PCCs),并将其与随机数据集进行了比较(). 大约150个核心相互作用(9.5%)对应于PCCs显著高于随机预期的基因对(P(P)<0.05)(表S3)。因此,这些配对可以被认为“在生物学上更有可能”,因为两种完全独立的方法指出了相应基因之间的功能关系。其余的配对标记为“无其他证据”。事实上,重要的是要注意,缺乏共表达并不意味着相应的相互作用是无关的。事实上,75%的被定义为生物学相关的文献对与转录组数据无关().
我们还系统地研究了Y2H相互作用,其中这两种蛋白质属于共同的秀丽线虫表达式簇或“Topomap山脉”(18). 例如,来自29号山的高度连接子网()包含七个共享公共域(DUF139域和富含半胱氨酸重复序列)的蛋白质(ABU-1、ABU-8、ABU-11、PQN-5、PQN-54、PQN-57和PQN-71)。此外,这些蛋白都在咽部表达(19-21)这表明它们可能在咽部功能或发育中共同作用。
对于相对较小的酿酒酵母和秀丽线虫相互作用数据集,物理相互作用指的是基因敲除或敲除时具有相似表型的基因(17). 为了评估这个想法秀丽线虫相互作用组,我们根据来自WormBase的RNA干扰(RNAi)敲除实验收集了一组表型数据(7,22),我们计算了相互作用数据集及其随机对照中共享胚胎致死表型的蛋白质相互作用对的百分比,并发现核心数据集和第一通过数据集的双重富集(). 母体不育表型和四组胚胎后表型也观察到类似的相关性(23). 由于两个基因在多种条件下共存并在敲除时表现出相似表型的蛋白质相互作用特别可能,因此上述全球相关性说明了如何从重叠相互作用组、转录组、,和现象数据集(表S3)。
在酿酒酵母,两种具有许多共同作用伙伴的蛋白质更有可能在生物学上相关(24). 我们检查了秀丽线虫通过确定网络中蛋白质之间的相互聚集系数,相互作用组网络存在高度连接的邻域(表S4)(24). 例如,我们检查了包含这样一个高得分蛋白质对的簇之一的属性:VAB-3/C49A1.4(). VAB-3和C49A1.4与果蝇属基因无眼的(依)和眼睛缺失(艾娅),但不是彼此。EY和EYA是调节眼睛发育的转录因子保守网络的组成部分(25).
VAB-3和C49A1.4周围高度互联子网的图形表示。生物功能类别从WormPD获得(10).
VAB-3和C49A1.4是WI5中高度互联子网的一部分()已知或怀疑在功能上与VAB-3和C49A1.4或其在其他生物体中各自的同源物相关的蛋白质。其中包括(i)EGL-27,它对雌雄同体中的MAB-5起负调节作用(26)并通过C49A1.4与MAB-5相连;(ii)WRT-2,C49A1.4的相互作用体,与果蝇属刺猬,可以缓解艾娅表达式Cubitus interruptus公司(27); 和(iii)CEH-33和CEH-35眼正弦同源异型盒基因家族果蝇属转录因子as的调控网络依和艾娅(28). 最后,该簇中的八个蛋白质在WormPD中被注释为与膜功能有关,这表明了在无眼的转录网络和膜活性。
Y2H数据集与interology和先前描述的相互作用一起,为细胞中数千个无特征的蛋白质提供了功能假设秀丽线虫蛋白质组。与其他功能基因组数据的整合表明,转录组和相互作用组数据之间的相关性虽然显著,但低于在酵母中观察到的预期值(17). 此观察结果既适用于此处描述的Y2H数据集,也适用于来自文献衍生数据集的特征鲜明的蠕虫交互(). 这可能是因为,与单细胞生物不同,后生动物的生物过程可能在生物体内、不同器官、组织或单个细胞中以不同的方式发生,这使其变得复杂。
我们当前的相互作用组图还说明了人类相互作用组项目如何从使用重组克隆系统(如Gateway)的ORFeome克隆项目中受益(8). 事实上,重组克隆的ORF可以随意转换为不同类型蛋白质相互作用分析所需的各种表达载体,例如我们能够将诱饵和预编码ORF转换为Myc和GST标记的载体以验证Y2H相互作用。