×

亚细胞定位的人类蛋白质特征。 (英语) Zbl 1412.92111号

摘要:蛋白质负责执行对细胞生存至关重要的绝大多数细胞功能。蛋白质亚细胞定位的知识可以提供有关其分子功能的宝贵信息。因此,细胞生物学和蛋白质组学的基本目标之一是分析这些蛋白质的亚细胞定位和功能。最近大规模的人类基因组学和蛋白质组学研究使得在亚细胞定位水平上表征人类蛋白质成为可能。在这项研究中,根据Swiss-Prot中的注释,8842个人类蛋白质被分为七个亚细胞定位。通过使用拓扑特性、生物学特性、密码子使用指数、mRNA表达水平、蛋白质复杂性和物理化学特性来比较七个亚细胞定位中的人类蛋白质。所有这些性质在七个类别中都有显著差异。此外,基于这些性质和伪氨基酸组成,构建了一个机器学习分类器,用于预测蛋白质亚细胞定位。这项研究试图解决上述特性,以比较不同亚细胞定位的人类蛋白质。我们希望我们的研究结果能为预测蛋白质亚细胞定位和理解人类蛋白质在细胞中的一般功能提供重要帮助。

MSC公司:

92C40型 生物化学、分子生物学
92立方37 细胞生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿什伯恩,M。;鲍尔,C.A。;布雷克·J·A。;博茨坦,D。;巴特勒,H。;Cherry,J.M。;Davis,A.P。;Dolinski,K。;德怀特,S.S。;Eppig,J.T.,《基因本体论:生物学统一的工具》,《自然遗传学》。,25, 25-29 (2000)
[2] Bairoch,A。;Boeckmann,B.,瑞士普罗特蛋白质序列数据库,核酸研究,19,2247-2249(1991)
[3] 贝特曼,A。;硬币,L。;杜宾,R。;R·D·芬恩。;Hollich,V。;Griffiths-Jones,S。;Khanna,A。;马歇尔,M。;Moxon,S。;Sonnhammer,E.L.L.,Pfam蛋白质家族数据库,核酸研究,32,D138-D141(2004)
[5] 巴斯卡兰,R。;Ponnuswamy,P.,球形蛋白质中氨基酸残基的位置灵活性,国际期刊Pept。蛋白质研究,32,241-255(1988)
[6] 比奥,V。;Gibrat,J。;莱文,J。;罗布森,B。;Garnier,J.,二级结构预测:三种不同方法的组合,蛋白质工程,2185-191(1988)
[7] Brown,K.R。;Jurisica,I.,在线预测人类交互数据库,生物信息学,212076-2082(2005)
[8] C.伯格。;Karlin,S.,《人类基因组DNA中完整基因结构的预测》,《分子生物学》。,268, 78-94 (1997)
[9] Chang,C.C。;Lin,C.J.,LIBSVM:支持向量机库(2011),(软件可从以下网址获得:)
[10] Chen,W。;冯,P.M。;Lin,H。;Chou,K.C.,iRSpot PseDNC:鉴定具有伪二核苷酸组成的重组点,核酸研究,41(2013),(e68-e68)
[11] Chen,W.H。;明格兹,P。;勒彻,M.J。;Bork,P.,OGEE:在线基因重要性数据库,核酸研究,40,D901-D906(2012)
[12] Chen,Y.L。;Li,Q.Z.,利用改进的杂交方法和伪氨基酸组成预测凋亡蛋白的亚细胞定位,J.Theor。《生物学》,248377-381(2007)·Zbl 1451.92113号
[13] Chen,Y.L。;李庆忠,凋亡蛋白亚细胞位置预测,J.Theor。生物学,245775-783(2007)·Zbl 1451.92112号
[14] Chin,C.S。;Samanta,M.P.,基于蛋白质相互作用网络渗透方法的全球快照,生物信息学,192413-2419(2003)
[15] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构。功能。遗传学。,43, 246-255 (2001)
[16] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[17] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[18] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,9, 1092-1100 (2013)
[19] Chou,K.C。;Elrod,D.W.,蛋白质亚细胞位置预测,蛋白质工程,12,107-118(1999)
[20] Chou,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.Theor。生物学,277,45765-45769(2002)
[21] Chou,K.C。;沈海斌,蛋白质亚细胞定位预测的最新进展,分析。生物化学。,370, 1-16 (2007)
[22] Chou,K.C。;Shen,H.B.,Cell-PLoc:一个用于预测各种生物体中蛋白质亚细胞定位的Web服务器包,《国家协议》。,3153-162(2008年)
[23] Chou,K.C。;Shen,H.B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63-92 (2009)
[24] Chou,K.C。;Shen,H.B.,Plant-mPLoc:一种自上而下的策略,以增强预测植物蛋白质亚细胞定位的能力,《公共科学图书馆·综合》,5,e11335(2010)
[25] Chou,K.C。;Shen,H.B.,预测单位点和多位点真核蛋白亚细胞定位的新方法:Euk-mPLoc 2.0,PLoS One,5,e9931(2010)
[26] Chou,K.C。;Jones博士。;Heinrikson,R.L.,caspase-8三级结构和底物结合位点的预测,FEBS Lett。,419, 49-54 (1997)
[27] Chou,K.C。;托马塞利,A.G。;Heinrikson,R.L.,caspase-9/抑制剂复合物三级结构的预测,FEBS Lett。,470, 249-256 (2000)
[28] Chou,K.C。;吴振聪。;Xiao,X.,iLoc-Euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,PLoS One,6,e18258(2011)
[29] Chou,K.C。;吴振聪。;Xiao,X.,iLoc-Hum:利用累积-标签尺度预测人类蛋白质在单位点和多位点的亚细胞位置,Mol.Biosyst。,8, 629-641 (2012)
[30] 科尔特斯,C。;Vapnik,V.,支持向量网络,马赫。学习。,20, 273-297 (1995) ·Zbl 0831.68098号
[31] Drawid,A。;Jansen,R。;Gerstein,M.,将表达水平与蛋白质亚细胞定位相关的全基因组分析,《趋势遗传学》。,16, 426-430 (2000)
[32] Dreger,M.,亚细胞蛋白质组学,质谱学。修订版,22,27-56(2003)
[33] 艾森,M.B。;斯佩尔曼,P.T。;Brown,首席执行官。;Botstein,D.,全基因组表达模式的聚类分析和显示,Proc。国家。阿卡德。科学。美国,95,14863-14868(1998)
[34] Ermolaeva,M.D.,细菌中的同义密码子用法,Curr。发行分子生物学。,3, 91-97 (2001)
[35] Fan,G.L。;Li,Q.Z.,通过将伪平均化学位移纳入周氏伪氨基酸组成的一般形式,预测分枝杆菌蛋白质的亚细胞位置,J.Theor。生物,304,88-95(2012)·Zbl 1397.92186号
[36] Fan,Y.N。;Xiao,X。;Min,J.L。;Chou,K.C.,iNR-Drug:预测药物与细胞网络中核受体的相互作用,国际分子科学杂志。,15, 4915-4937 (2014)
[37] 弗里曼,L.C.,《中心图与自我网络的结构》,数学。社会科学。,3921-304(1982年)·Zbl 0495.90048号
[38] Fu,L。;牛,B。;朱,Z。;Wu,S。;Li,W.,CD-HIT:加速聚类下一代测序数据,生物信息学,283150-3152(2012)
[39] Ghaemaghami,S。;嗯,W.K。;鲍尔,K。;豪森,R.W。;Belle,A。;德普霍尔,N。;O'Shea,E.K。;Weissman,J.S.,《酵母中蛋白质表达的全球分析》,《自然》,425737-741(2003)
[40] Goh,K.I。;M.E.库西克。;瓦莱,D。;Childs,B。;维达尔,M。;Barabasi,A.L.,人类疾病网络,Proc。国家。阿卡德。科学。美国,104,8685-8690(2007)
[41] Goldberg,D.S。;Roth,F.P.,《评估小世界中实验得出的相互作用》,Proc。国家。阿卡德。科学。美国,1004372-4376(2003)·Zbl 1132.92327号
[42] Grantham,R.,《帮助解释蛋白质进化的氨基酸差异公式》,《科学》,185862-864(1974)
[43] 郭S.H.、邓E.Z.、徐L.Q.、丁H.、林H.、陈W.、周K.C.,2014年。iNuc-PseKNC:一种基于序列的伪(k)预测基因组核小体定位的预测因子;郭S.H.、邓E.Z.、徐L.Q.、丁H.、林H.、陈W.、周K.C.,2014年。iNuc-PseKNC:一种基于序列的预测因子,用于预测伪(k)基因组中核小体定位
[44] Gygi,S.P。;Rist,B。;Gerber,S.A。;Turecek,F。;Gelb,M.H。;Aebersold,R.,使用同位素编码亲和标签对复杂蛋白质混合物进行定量分析,国家生物技术。,17, 994-999 (1999)
[45] Hamosh,A。;A.F.斯科特。;Amberger,J.S。;博奇尼,C.A。;McKusick,V.A.,人类孟德尔遗传(OMIM),人类基因和遗传疾病的知识库,核酸研究,33,D514-D517(2005)
[46] Han,H.W。;Bae,S.H。;Jung,Y.H。;Moon,J.,基本基因和含TATA基因之间关系的全基因组特征,FEBS Lett。,587, 444-451 (2013)
[47] Han,H.W。;Ohn,J.H。;Moon,J。;Kim,J.H.,互惠无标度生物网络之间疾病基因和死亡基因的阴阳,核酸研究,41,9209-9217(2013)
[48] 霍普,T.P。;Woods,K.R.,从氨基酸序列预测蛋白质抗原决定簇,Proc。国家。阿卡德。科学。美国,78,3824-3828(1981)
[49] 黄,T。;张杰。;徐振平。;胡,L.-L。;Chen,L。;Shao,J.L。;张,L。;Kong,X.Y。;Cai,Y.D。;Chou,K.C.,使用网络和机器学习方法解读基因缺失对酵母寿命的影响,Biochimie,941017-1025(2012)
[50] 哈伯德,T。;巴克,D。;伯尼,E。;卡梅隆,G。;陈,Y。;克拉克,L。;考克斯·T。;袖口,J。;Curwen,V。;Down,T.,The Ensemble基因组数据库项目,核酸研究,30,38-41(2002)
[51] 北卡罗来纳州胡洛市。;Bairoch,A。;布利亚德,V。;Cerutti,L。;德卡斯特罗,E。;Langendijk-Genevaux,P.S。;Pagni,M。;Sigrist,C.J.,PROSITE数据库,核酸研究,34,D227-D230(2006)
[52] Hurst,L.D.,《Ka/Ks比率:序列进化形式的诊断》,《遗传学趋势》。,18, 486-487 (2002)
[53] 黄,Y.C。;林,C.C。;Chang,J.Y。;Mori,H。;胡安·H·F。;Huang,H.C.,基于网络和序列分析的基本基因预测,分子生物学。,1672-1678年5月(2009年)
[54] Ikemura,T大肠杆菌转移RNAs及其蛋白质基因中各自密码子的出现:一项针对同义密码子选择的建议大肠杆菌翻译系统,J.Mol.Biol。,151, 389-409 (1981)
[55] Janin,J。;沃达克,S。;莱维特,M。;Maigret,B.,蛋白质中氨基酸侧链的构象,《分子生物学杂志》。,125, 357-386 (1978)
[56] Jeong,H。;梅森,S.P。;Barabási,A。;Oltvai,Z.N.,蛋白质网络中的致死性和中心性,《自然》,411,41-42(2001)
[57] 乔伊斯·A·R。;Reed,J.L。;怀特,A。;Edwards,R。;奥斯特曼,A。;Baba,T。;Mori,H。;莱斯利,S.A。;B.Palsson。;Agarwalla,S.,实验和计算评估大肠杆菌,《细菌学杂志》。,188, 8259-8271 (2006)
[58] Kanehisa,M。;Goto,S。;川岛,S。;Okuno,Y。;Hattori,M.,《解译基因组的KEGG资源》,《核酸研究》,32,D277-D280(2004)
[59] 川岛,S。;Pokarowski,P。;波卡罗夫斯卡,M。;科林斯基,A。;Katayama,T。;Kanehisa,M.,AAindex:氨基酸指数数据库,2008年进度报告,核酸研究,36,D202-D205(2008)
[60] 科特利亚尔,M。;Fortney,K。;Jurisica,I.,《基于网络的药物调节基因、药物靶点和毒性表征》,方法,57499-507(2012)
[61] Kurland,C.,密码子偏差和基因表达,FEBS Lett。,285, 165-169 (1991)
[62] Laxton,R.,《多样性的衡量》,J.Theor。生物学,70,51-67(1978)
[63] 李碧琴。;胡丽莲。;牛,S。;Cai,Y.D。;Chou,K.C.,使用mRMR和IFS方法预测和分析S-亚硝化修饰位点,《蛋白质组学杂志》,75,1654-1665(2012)
[64] 李,Z.C。;Lai,Y.H。;Chen,L.L。;陈,C。;谢毅。;戴,Z。;邹晓勇,基于图论和随机森林算法识别哺乳动物蛋白质复合体的亚细胞定位,分子生物晶体。,9658-667(2013年)
[65] Lin,C.Y。;Chin,C.H.(中国)。;Wu,H.H。;Chen,S.H。;Ho,C.W。;Ko,M.T.,Hubba:hub objects analyzer网络生物学交互组hub识别框架,《核酸研究》,36,W438-W443(2008)
[66] Lin,H.,利用周的伪氨基酸组成预测外膜蛋白的改良马氏判别法,J.Theor。《生物学》,252350-356(2008)·Zbl 1398.92076号
[67] Lin,H。;Li,Q.Z.,利用伪氨基酸组成和改良马氏判别法预测芋螺毒素超家族和家族,生物化学。生物物理学。Res.Commun.公司。,354, 548-551 (2007)
[68] Lin,S.X。;Lapointe,J.,《理论与实验生物学一体化》,J.Biomed。科学。工程师,6435-442(2013)
[69] 刘,B。;张,D。;Xu,R。;徐,J。;王,X。;陈,Q。;Dong,Q。;Chou,K.C.,将从频率剖面提取的进化信息与基于序列的内核相结合,用于蛋白质远程同源性检测,生物信息学,30472-479(2013)
[70] Luby-Phelps,K.,《细胞质的细胞结构和物理特性:体积、粘度、扩散、细胞内表面积》,《细胞学国际评论》。,192189-221(1999年)
[71] 马丁,I.V。;MacNeill,S.A.,裂变酵母基本DNA连接酶I蛋白中亚细胞定位和蛋白质相互作用序列的功能分析,核酸研究,32,632-642(2004)
[72] 马提斯,V。;弗里克·E。;Geffers,R。;Gößling,E。;Haubrock,M。;Hehl,R。;霍尼舍尔,K。;卡拉斯,D。;凯尔,A.E。;Kel-Margoulis,O.V.,(TRANSFAC^®):转录调控,从模式到剖面,核酸研究,31,374-378(2003)
[73] McBride,H.M。;Neuspiel,M。;Wasiak,S.,线粒体:不仅仅是一个发电站,Curr。生物,16,R551-R560(2006)
[74] Mei,S.,通过基于多标签同源知识转移学习的Chou的PseAAC公式预测植物蛋白质亚细胞多定位,J.Theor。生物学,310,80-87(2012)·Zbl 1337.92065号
[75] Min,J.L。;Xiao,X。;Chou,K.C.,iEzy-Drug:一个网络服务器,用于识别细胞网络中酶和药物之间的相互作用,Biomed。Res.Int.,701317(2013)
[76] 森山,E.N。;Powell,J.R.,基因长度和密码子使用偏差黑腹果蝇,酿酒酵母大肠杆菌《核酸研究》,26,3188-3193(1998)
[77] Nakai,K.,蛋白质分类信号和亚细胞定位预测,高级蛋白质化学。,54, 277-344 (2000)
[78] 鲍威尔,J.R。;Moriyama,E.N.,《果蝇密码子使用偏好的进化》,Proc。国家。阿卡德。科学。美国,947784-7790(1997)
[79] Przulj,N。;Wigle,D.A。;Jurisica,I.,蛋白质相互作用网络中的功能拓扑,生物信息学,20,340-348(2004)
[80] 邱伟荣。;Xiao,X。;Chou,K.C.,iRSpot-TNCPseAAC:用三核苷酸成分和伪氨基酸成分识别重组点,国际分子科学杂志。,1746-1766年(2014年)
[81] 拉瓦斯,E。;Somera,A.L。;Mongru,D.A。;Oltvai,Z.N。;Barabási,A.,代谢网络中模块性的层次结构,《科学》,2971551-1555(2002)
[82] Rocha,E.P.,从tRNA的角度看密码子使用偏差:冗余、专门化和翻译优化的有效解码,《基因组研究》,第14期,第2279-2286页(2004年)
[83] Rual,J.F。;肯塔基州文凯特桑。;郝,T。;Hirozane Kishikawa,T。;德里科特,A。;李,N。;Berriz,G.F。;吉本斯,F.D。;Dreze,M。;Ayivi Guedehoussou,N.,《走向人类蛋白质相互作用网络的蛋白质尺度图》,《自然》,4371173-1178(2005)
[84] Ruepp,A。;布劳纳,B。;Dunger-Kaltenbach,I。;弗里希曼,G。;蒙特罗内,C。;斯特兰斯基,M。;Waegele,B。;施密特,T。;O.N.杜迪厄。;Stümpflen,V.,CORUM:哺乳动物蛋白质复合物的综合资源,核酸研究,36,D646-D650(2008)
[85] 夏普,P.M。;Li,W.H.,密码子适应指数——定向同义密码子使用偏差的测量及其潜在应用,《核酸研究》,第15期,第1281-1295页(1987年)
[86] 美国斯特尔兹尔。;Worm,美国。;拉洛夫斯基,M。;Haenig,C。;Brembeck,F.H。;戈勒,H。;斯特罗德克,M。;Zenkner,M。;Schoenherr,A。;Koeppen,S.,《人类蛋白质相互作用网络:蛋白质组注释资源》,《细胞》,122957-968(2005)
[87] Tsien,R.Y.,绿色荧光蛋白,Annu。生物化学评论。,67, 509-544 (1998)
[88] Wachi,S。;Yoneda,K。;Wu,R.,相互作用-转录组分析揭示了肺癌组织差异表达基因的高度集中性,生物信息学,214205-4208(2005)
[89] Wan,S。;Mak,M.W。;Kung,S.Y.,GOASVM:一种亚细胞位置预测因子,通过将术语频率基因本体纳入周氏伪氨基酸组成的一般形式,J.Theor。生物学,323,40-48(2013)·Zbl 1314.92060号
[90] 王,C。;蒋伟(Jiang,W.)。;李伟(Li,W.)。;Lian,B。;陈,X。;Hua,L。;Lin,H。;李,D。;李,X。;刘振华,人蛋白质相互作用网络中微RNA调控药物靶点的拓扑性质,药物靶点杂志。,19, 354-364 (2011)
[91] 王,X。;Wang,R。;Zhang,Y。;Zhang,H.,可药用蛋白质靶标亚细胞定位的进化调查,基因组生物学。演变。,5129-1297(2013年)
[92] Watts,D.J。;Strogatz,S.H.,“小世界”网络的集体动态,《自然》,393,440-442(1998)·兹比尔1368.05139
[93] Wright,F.,基因中使用的“有效密码子数”,gene,87,23-29(1990)
[94] 吴,C。;麦克劳德,I。;Su,A.I.,BioGPS和MyGene.info:在线组织,以基因为中心的信息,核酸研究,41,D561-D565(2013)
[95] 吴振聪。;Xiao,X。;Chou,K.C.,iLoc-Plant:一种多标记分类器,用于预测具有单位点和多位点的植物蛋白质的亚细胞定位,Mol.Biosyst。,7, 3287-3297 (2011)
[96] 吴振聪。;Xiao,X。;Chou,K.C.,iLoc-Gpos:预测单复合体和多重革兰氏阳性细菌蛋白的亚细胞定位的多层分类器,Protein Pept。莱特。,19, 4-14 (2012)
[97] Wuchty,S.,《酵母蛋白相互作用网络的进化和拓扑结构》,《基因组研究》,第14期,1310-1314页(2004年)
[98] Wuchty,S。;Almas,E.,剥离酵母蛋白质网络,蛋白质组学,5,444-449(2005)
[99] Xiao,X。;Wu,Z.C。;Chou,K.C.,《预测革兰氏阴性细菌蛋白质亚细胞定位的单位点和多位点多标签分类器》,《公共科学图书馆·综合》,6,e20592(2011)
[100] Xiao,X。;吴振聪。;Chou,K.C.,iLoc-Virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.Theor。《生物学》,284,42-51(2011)·Zbl 1397.92238号
[101] Xiao,X。;Min,J.L。;王,P。;Chou,K.C.,iCDI-PseFpt:利用PseAAC和分子指纹识别细胞网络中的通道药物相互作用,J.Theor。《生物学》,337,71-79(2013)·Zbl 1411.92115号
[102] 徐,J。;Li,Y.,通过人类蛋白质相互作用网络的拓扑特征发现疾病基因,生物信息学,222800-2805(2006)
[103] Xu,Y。;邵晓杰。;Wu,L.Y。;邓,纽约。;Chou,K.C.,iSNO-AAPAR:将氨基酸成对偶联到PseAAC中以预测蛋白质中半胱氨酸S-亚硝基化位点,PeerJ,1,e171(2013)
[104] Yang,L。;Li,Q.Z.,通过多样性增加预测突触前和突触后神经毒素,毒理学。《体外》,23346-348(2009)
[105] Yang,L。;Wang,J。;Wang,H。;吕,Y。;Zuo,Y。;姜伟,《利用蛋白质相互作用网络的拓扑特性分析和识别毒素靶点》,J.Theor。《生物学》,349,82-91(2014)·Zbl 1412.92112号
[106] Y’ld’r’m,文学硕士。;Goh,K.I。;M.E.库西克。;Barabási,A.L。;Vidal,M.,Drug-target network,国家生物技术。,25, 1119-1126 (2007)
[107] Yu,H。;Kim,P.M。;Sprecher,E。;Trifonov,V.公司。;Gerstein,M.,蛋白质网络中瓶颈的重要性:与基因重要性和表达动力学的相关性,PLoS Comput。生物,3,e59(2007)
[108] 袁,L.F。;丁,C。;Guo,S.H。;丁·H。;Chen,W。;Lin,H.,基于径向基函数网络的离子通道靶向芋螺毒素类型预测,毒理学。《体外》,27852-856(2013)
[109] 张,L。;胡克。;Tang,Y.,通过人类蛋白质相互作用网络中的拓扑相似性预测疾病相关基因,Cent。《欧洲物理学杂志》。,8, 672-682 (2010)
[110] 周国平。;K博士,凋亡蛋白的亚细胞定位预测,蛋白质:结构。功能。遗传学。,50, 44-48 (2003)
[111] 朱,M。;高,L。;李,X。;刘,Z。;徐,C。;Yan,Y。;Walker,E。;蒋伟(Jiang,W.)。;苏,B。;Chen,X.,基于人类蛋白质相互作用网络拓扑特性的药物靶点分析,J.drug Target。,17, 524-532 (2009)
[112] Zuo,Y.C。;Li,Q.Z.,《使用减少的氨基酸组成预测防御素家族和亚家族:结合相似性度量和结构字母表》,《肽》,301788-1793(2009)
[113] Zuo,Y.C。;Li,Q.Z.,利用(K)-多样性最小增量预测基于氨基酸分组的疟原虫分泌蛋白,氨基酸,38,859-867(2010)
[114] Zuo,Y.C。;Chen,W。;Fan,G.L。;Li,Q.Z.,区分嗜温性和嗜热性蛋白质的多样性度量的相似距离,氨基酸,44573-580(2013)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。