摘要

单细胞蛋白质组学(SCP)已成为检测细胞异质性的有力工具,为研究体细胞群中隐藏的生物学机制提供了前所未有的见解。随着基于人工智能的时间轨迹分析和细胞亚群识别的快速发展,迫切需要一个数据库,该数据库不仅提供SCP原始数据,还明确描述实验细节和蛋白质表达谱。然而,目前还没有这样的数据库。在这项研究中,开发了一个名为“SingPro”的数据库,专门研究单细胞蛋白质组学。它的独特之处在于:(a)系统地为这两个方面提供SCP原始数据质谱法-基于和流式细胞术-基础研究和(b)明确描述SCP研究的实验细节和任何研究蛋白质的表达谱。预计研究界会对此产生浓厚兴趣,该数据库将成为基于OMIC的生物医学研究的宝贵资源库。访问SingPro是不受限制的,不强制登录:http://idrblab.org/singpro/.

介绍

单细胞蛋白质组学(SCP)已成为检测细胞异质性的有力工具,为研究体细胞群中隐藏的生物学机制提供了前所未有的见解(1,2). 如图所示1,目前SCP研究中广泛采用了两种技术():流式细胞术-基于一种抗体(FC-SCP)测量每个细胞高达50个蛋白质,显示出识别疾病特异性细胞亚群和监测信号转导的显著能力(4–7);质谱法-与FC-SCP相比,基于MS-SCP对每个细胞600多个蛋白质进行定量,但吞吐量有限,灵敏度相对较低,这使得它适合于识别新的标记物和追踪罕见的细胞群体(8–11). 这两种技术都很强大,经常被用来测量交货时间(12),揭示细胞之间的异质性(13,14)实现高含量药物筛选(15)等等。

单细胞蛋白质组学(SCP)分析中采用的两种典型实验程序的流程图,包括基于质谱法和基于流式细胞术的SCP分析。对于基于质谱的SCP,首先分离单个细胞(a1),然后对(a2)进行裂解、消化和标记,最后根据MS数据对(a3)进行量化,并使用通路富集、表达分化等进行分析。对于基于流式细胞术的SCP来说,首先将所有细胞(b1)处理成单细胞悬浮液,(b2)然后用抗体染色,(b3)最后根据FC数据进行量化,并使用细胞亚群识别、时间轨迹干扰等方法进行分析。
图1。

单细胞蛋白质组学(SCP)分析中采用的两种典型实验程序的流程图,包括质谱法-基于和流式细胞术-基于SCP分析。对于质谱法-基于SCP,单个单元(a1级)第一次隔离(a2类)然后溶解、消化并标记(a3类)最后根据MS数据进行量化,并使用通路富集、表达分化等进行分析流式细胞术-基于SCP,所有单元格(b1号机组)首先处理成单细胞悬浮液(b2型)然后用抗体染色(b3号机组)最后基于FC数据进行量化,并使用细胞亚群识别、时间轨迹干扰等进行分析。

然而,极高的实验成本和耗时的分析过程限制了可公开访问的SCP数据的可用性(16–18). SCP研究需要复杂的数据处理和分析程序,应提供原始数据以选择合适的过程(19–21). 同时,如果没有相应的原始SCP数据,则很难进行基于SCP的元分析和多元分析(22–25). 例如,SCP和单细胞转录组学(SCT)数据的整合被认为是对生物特征/动力学理解的革命性(26,27),但SCP和SCT之间的原始数据量不相等极大地阻碍了它(28). 随着基于人工智能的时间轨迹分析和细胞亚群识别的快速发展,迫切需要一个数据库,该数据库不仅提供SCP原始数据,还明确描述实验细节和蛋白质表达谱(29–32).

到目前为止,已经开发了几个与蛋白质组学相关的数据库(33–42). 其中一些提供存储和下载质谱法-基于大量蛋白质组数据,如ProtomeXchange(33),骄傲(34)和iProX(36); 其他一些是公共存储库,提供使用生成的实验数据细胞术促进细胞分类和免疫表型分析的技术,如FlowRepository(39)和Immport(40). 还有几个R包可以用来获得SCP数据,例如scpdatea(43). 然而,它们都没有专门为基于MS或基于FC的技术提供SCP原始数据。此外,现有数据库专门用于提供蛋白质组数据的科学存储,但缺少对实验细节的描述(例如研究程序、样品标签、带注释的细胞类型以及单细胞分类和制备方法)以及缺少数据处理和分析的应用,使得研究人员,尤其是那些没有生物信息学背景的研究人员,很难直观地使用所提供的数据并理解蛋白质表达谱。因此,迫切需要一个专门提供SCP原始数据以及实验细节和表达谱的明确描述的数据库。

为了解决这一差距,我们开发了“SingPro”,这是一个专为单细胞蛋白质组学设计的数据库。弗斯特进行了系统的文献综述,共有204项研究(129项病例对照研究、21项多类研究和54项单臂研究),包含了>6.25亿个细胞和>1.6万个蛋白质的SCP原始数据。第二实验细节(抗体组、研究程序、样品标签、注释细胞类型、单细胞分选和制备方法等)是在原始出版物的基础上手动检索和标准化的。第三,使用成熟的工具对所有原始数据进行处理和分析,以测量每个蛋白质样本组之间的表达谱。最后为方便SCP数据的使用,构建了带有快速搜索实用程序的用户友好界面。总而言之,SingPro数据库在以下方面是独一无二的:(a)系统地为这两个数据库提供SCP原始数据质谱法-基于和流式细胞术-基础研究和(b)明确描述SCP研究的实验细节和研究蛋白质的表达谱。由于研究界的广泛兴趣,该数据库有望成为一个有价值的存储库,以促进基于OMIC的生物医学研究。

事实内容和数据检索

单细胞蛋白质组数据的系统收集

SingPro的单细胞蛋白质组数据进行了系统整理,如下所述。弗斯特,通过搜索PubMed,使用关键词组合,如“质谱+蛋白质组学”、“流式细胞术+蛋白质组”、“单细胞+蛋白质组论”、“单个细胞+质谱”、“细胞术飞行时间”、,共产生5780篇文章。第二系统地从原始出版物中检索每个单细胞蛋白质组数据的详细信息(如研究物种、疾病适应症、临床状态和实验程序),并将其统一和链接到已建立的数据库。最后共收集了204项研究(129项病例对照研究、21项多类研究和54项单臂研究),其中包含>6.25亿个细胞和>16000个蛋白质的SCP原始数据。因此,SingPro提供了来自人类和各种模型生物(例如小家鼠,非洲爪蟾猕猴)组织/器官(如外周血、肾脏和乳腺)。此外,策划的数据涵盖了广泛的疾病,不仅包括癌症,还包括感染、消化系统疾病等疾病。

SingPro中每个SCP数据集的一般信息

对于每个SCP研究,其一般信息显示在相应SCP网页的上部,例如:项目ID、项目标题、描述、研究类型、原始出版物的参考链接、数据处理和分析工具(如图所示2). SCP中两种常用的研究类型包括细胞亚群鉴定(用于发现新的标记蛋白(44–46))和时间轨迹干扰(用于揭示信号通路和疾病进展的机制(47,48). 为了方便用户识别出适合自己研究目的的理想数据并选择合适的分析算法,对收集到的SCP研究的各种研究类型进行了总结,这些研究类型包括细胞群体识别、时间轨迹干扰(带有明确的时间点)、,比较研究(描述不同的数据组)和新方法(描述实验程序和设备创新)。此外,SingPro还引入并链接了ANPELA等著名数据处理工具(49)和细胞库(41),为渴望重新调整数据用途的用户简化了流程。

一个典型的SingPro页面,描述单细胞蛋白质组学研究的一般信息。每个研究和数据集的信息在上面部分明确提供,包括:项目ID、项目标题、描述、研究类型、样本类型(单细胞/小细胞群体)、参考和成熟数据处理和分析工具的外部链接。项目文件在以下部分中建立,包括:文件类型、下载链接(用于即时下载单个文件)、下载ID和相应的着色面板。用户可以在复选框中选择所需的文件,然后单击“软件包下载”以激活批量下载。对于希望从不同研究批量下载文件的用户,还提供了一个数据下载工具,用于从不同研究下载多个文件。
图2。

一个典型的SingPro页面,描述单细胞蛋白质组学研究的一般信息。每个研究和数据集的信息在上一节中明确提供,包括:项目ID、项目标题、描述、研究类型、样本类型(单细胞/小细胞种群)、参考和已建立的外部链接数据处理与分析工具。项目文件在以下部分中建立,包括:文件类型、下载链接(用于即时下载单个文件)、下载ID和相应的着色面板。用户可以在复选框中选择所需的文件,然后单击“软件包下载'以激活批下载。对于希望从不同研究批量下载文件的用户数据下载工具还可以从各种研究中下载多个文件。

描述SCP数据集的量化过程

对于每个流式细胞术-基于SCP研究,SingPro数据库中提供了其生物信息,如物种、组织、细胞类型和研究条件。根据抗体类型,FC-SCP研究可进一步分为两种定量方法:基于荧光的流式细胞术使用荧光标签,以及飞行时间细胞术(CyTOF)使用重金属同位素标记。对于每种方法,都开发了各种数据处理和分析工具,如CATALYST和CytoSpill是专门用于CyTOF的补偿工具。为了使用户能够选择适合该数据的后续分析方法,SingPro提供了量化过程描述,如原始出版物中采用的量化方法、仪器、数据处理方法和数据分析方法。还提供了染色面板,使研究人员能够直接确定研究中是否含有他们喜欢的蛋白质,或者是否可以实现所需的聚集。每个研究的染色面板包含诸如蛋白质名称、与uniport的外部链接、荧光色素/金属同位素、类别(细胞内或表面蛋白质)和克隆号(如图所示).

描述基于流式细胞术的SCP定量过程的典型SingPro页面。每一页都精心组织成三个部分:生物信息(研究物种、实验组织/器官、分析细胞类型、病理/生理条件等)、单细胞蛋白质组量化(应用量化方法、实验平台、数据处理和分析方法等)、,和蛋白质组(荧光色素、蛋白质标记、外链、克隆、类别(表面/细胞内)和组数)。
图3。

典型的SingPro页面描述了流式细胞术-基于SCP。每一页都仔细地分为三个部分:生物信息(研究物种、实验组织/器官、分析的细胞类型、病理/生理条件等),单细胞蛋白质组量化(应用量化方法、实验平台、数据处理和分析方法等),以及蛋白质面板(荧光色素、蛋白质标记、外链、克隆、类别(表面/细胞内)和面板编号)。

对于每个质谱法-在SCP研究的基础上,明确描述了细胞类型信息,包括细胞系名称、物种、生物体、状况(健康或特定疾病),以及与其他成熟数据库(如Cellosaurus)的外部联系(50). MS-SCP的主要困难之一是每个细胞中的蛋白质量很小,正确的分类和后续预处理方法对于保护蛋白质免受消化损失和表面吸附至关重要(51). 因此,每个数据集的单细胞排序和预处理方法都是手动收集的,并在SingPro中明确描述,例如CelleONE(52),纳米波茨(53)以及其他流行的预处理平台。此外,SingPro还介绍了所使用的定量方法,如LC-MS/MS(液相色谱-质谱)、HPLC-FAIMS-MS/MS和CE-ESI-HRMS(毛细管电泳-电喷雾电离-高分辨率MS),量化策略(二甲基标记、TMT标记、无标记、数据采集等)和仪器,以便于选择适当的分析算法(如图所示4).

描述基于质谱的SCP量化过程的典型SingPro页面。每一页都被仔细地组织成四个部分:研究的单细胞类型(研究的物种、细胞、病理/生理条件等)、分类方法(方法名称及其应用细节)、制备方法(方法名及其应用详情)量化过程(应用的量化方法、量化策略、实验平台等)。
图4。

一个典型的SingPro页面描述了质谱法-基于SCP。每一页都被仔细地组织成四个部分:研究的单细胞类型(研究物种、细胞、病理/生理条件等),排序方法(方法名称及其应用细节),编制方法(方法名称及其应用细节)和量化过程(应用量化方法、量化策略、实验平台等)。

SCP数据处理和蛋白质表达谱

对于流式细胞术-基于SCP数据,将所有数据导入FlowJo(54)其中使用FlowAI进行质量控制(55). 去除异常后,数据被手动门控,以去除死细胞和其他非典型事件,并用反正弦变换进行缩放(56–59). 根据原始出版物对数据进行分组,使用双向学生测定各组间蛋白质表达差异的统计相关性t吨-测试,以及P(P)-数值<0.05被认为具有统计学意义。分析结果以方框图的形式显示在页面上,用户可以通过下拉框选择染色面板中的所有蛋白质,查看组间的表达水平(如图5).

一个典型的SingPro页面描述了使用基于流式细胞术的SCP数据的多组研究蛋白的表达变化。染色面板中的所有蛋白质都包含在下拉框中,用户可以在其中选择感兴趣的蛋白质。计算并提供两组之间所选蛋白质的P值。
图5。

一个典型的SingPro页面描述了所研究的蛋白质在多组之间的表达变化,使用流式细胞术-基于SCP数据。染色板中的所有蛋白质都包含在下拉框中,用户可以在下拉框中选择感兴趣的蛋白质。这个P(P)-计算并提供两组之间所选蛋白质的值。

对于质谱法-基于SCP数据,使用MaxQuant(版本2.4.0.0)处理原始数据(60). TMT通道、消化酶、缺失裂解、可变修饰和许多其他参数都是参考原始出版物设置的。对肽和蛋白质进行过滤,错误发现率<1%,以确保鉴定的可信度。MaxQuant修正后的报告离子强度被导入英仙座(61). 过滤掉反向和污染蛋白质,并考虑每个样品中含有70%以上有效值的蛋白质。然后对所有数据进行对数转换,并根据标准分布插补缺失值,方法是将宽度和降档分别设置为0.3和1.8(62). 折叠更改和双向学生t吨-通过设置折叠变化和P(P)-值分别为>2和<0.05)。由于MS-SCP量化的蛋白质比FC-SCP多得多,而且MS-SCP检测到的数千种蛋白质中只有少数是差异表达的,SingPro提供了火山图来显示差异表达的蛋白质,然后使用方框图来显示这些蛋白质在多组中的表达水平(如图所示6).

一个典型的SingPro页面,描述了使用基于质谱的SCP数据的多组研究蛋白质的表达变化。特别地,计算两组之间的火山图以提供蛋白质的差异表达谱(水平坐标表示对数2倍变化(Log2FC),垂直坐标表示对数P值(LogP);蛋白质根据其Log2FC和P值(分别为Log2FC>1和P值<0.05和Log2FC←1和P价值<0.05)被染成红色和蓝色。可以选择差异表达的蛋白质,并计算和提供两组之间所选蛋白质的P值。
图6。

一个典型的SingPro页面描述了多组研究蛋白的表达变化,使用质谱法-基于SCP数据。特别是,计算两组之间的火山图以提供蛋白质的差异表达谱(水平坐标表示对数2倍变化(日志2FC),垂直一表示对数P(P)-值(对数P(P)); 根据蛋白质的对数,蛋白质被涂成红色和蓝色2FC公司&P(P)-值(对数2FC>1&P(P)-值<0.05和Log2FC←1&P(P)-值分别<0.05)。可以选择差异表达的蛋白质P(P)-计算并提供两组间所选蛋白质的值。

SCP数据的标准化、访问和下载

为了方便用户访问和分析SingPro数据,对收集的所有数据进行了仔细清理,然后进行了系统标准化。这些标准化包括:(a)SingPro中的所有蛋白质、细胞系、物种和疾病都与uniprot等成熟的数据库交联(63),细胞龙(50)和NCBI分类(64); (b) 使用WHO ICD-11标准化所有疾病(65). SingPro提供了一个用户友好的界面,可以方便地浏览和搜索数据,并提供了快速搜索实用程序,允许用户根据实验登录号和样本参数,包括定量方法、疾病指征、,物种、组织、标记蛋白质等。所有数据都可以下载(包括MaxQuant分析结果、原始数据和许多其他相关文件,例如FASTA格式的蛋白质序列和补偿矩阵)。用户可以直接从相应页面下载所有这些数据,也可以使用SingPro数据库构建和提供的批量下载工具下载并编辑所需的文件列表。

结论和展望

在本研究中,引入了一个名为SingPro的新数据库,以提供全面的单细胞蛋白质组(SCP)数据。它专门从事(a)系统地为这两个领域提供SCP原始数据质谱法-和流式细胞术-基础研究和(b)明确描述SCP研究的实验细节和蛋白质的表达谱。随着高灵敏度质谱技术的最新突破,单细胞蛋白质组数据将呈指数级增长。因此,SingPro将及时更新。将添加流行的分析和可视化工具,如基于不同聚类方法的细胞亚群分析、时间轨迹推断和通路富集分析,以跟上正在进行的研究。由于研究界的广泛兴趣,SingPro有望成为现有分子生物学数据库的功能性和流行性补充(63,66–75)促进当前基于OMIC的研究。

数据可用性

所有单细胞蛋白质组学数据都可以从SingPro上查看、访问和下载,所有用户无需登录即可免费访问:http://idrblab.org/singpro/.

基金

国家自然科学基金项目[82373790222201020102001,U190920881872798];浙江省自然科学基金项目(LR21H300001);国家重点研发计划[2022YFC3400501];“万人计划”国家高层次人才专项支持计划领军人才;双一流大学[181201*194232101];中央高校基本科研业务费专项资金[2018QNA7023];浙江省重点研发计划[2020C03010];西湖实验室(西湖生命科学与生物医学实验室);阿里云;浙江大学信息技术中心;阿里巴巴-浙江大学未来数字医疗联合研究中心。开放存取费资助:浙江省自然科学基金[LR21H300001]。

利益冲突声明。未声明。

工具书类

1

戈希尔
S.H.公司。
,
伊奥古列斯库
J.B.公司。
,
布劳恩
D.A.公司。
,
凯斯金
D.B.公司。
,
利瓦克
K.J.公司。
高维单细胞技术在癌症免疫治疗分析中的应用
.
自然修订临床。昂科尔。
2021
;
18
:
244
256
.

2

戴维斯·马西萨克
电子频率。
,
德什潘德
答:。
,
斯坦·奥布赖恩
G.L.公司。
,
W.J.公司。
,
拉赫鲁
D。
,
扎菲
E.M.公司。
,
费蒂格
E.J.公司。
,
Kagohara公司
L.T.有限责任公司。
从工作台到床边:癌症免疫治疗的单细胞分析
.
癌细胞
.
2021
;
39
:
1062
1080
.

三。

斯拉沃夫
N。
解开单个细胞中的蛋白质组
.
科学类
.
2020
;
367
:
512
513
.

4

莱特·佩雷拉
答:。
,
奇切克
N。
,
兰博特
O。
,
勒格兰德
R。
,
科斯马
A类
利用72个细胞标记物的联合细胞仪分析HIV-ART患者白细胞特征
.
前面。免疫学。
2019
;
10
:
1777
.

5

冈萨雷斯
H。
,
教育与工业应用数学组织
西。
,
罗伯斯
一、。
,
哈格林
C、。
,
艾伦
B.M.公司。
,
Hauge Okholm公司
T.L.公司。
,
南贾拉吉
答:。
,
费尔贝克
T。
,
卡拉瓦切拉
美国。
,
梵高
M。
等。
人脑转移瘤的细胞构筑
.
单元格
.
2022
;
185
:
729
745
.

6

科特利亚尔
D。
,
阿联酋。
,
Logue(日志)
J。
,
休斯
T.K.公司。
,
库里
N.M.(最小值)。
,
拉朱
S.S.公司。
,
华兹华斯
M.H.医学博士。
第二
,
H。
,
库尔茨
J.R.公司。
,
Dighero-Kemp公司
B。
等。
体内埃博拉病毒病的单细胞分析揭示了病毒和宿主动力学
.
单元格
.
2020
;
183
:
1383
1401
.

7

舒尔特·施雷平
J。
,
罗伊施
N。
,
帕克利克
D。
,
巴斯勒
英国。
,
施利凯塞
美国。
,
B。
,
克莱默
B。
,
克拉默
T。
,
布鲁姆哈德
美国。
,
博纳古罗
L。
等。
严重的新型冠状病毒肺炎以髓细胞亚群失调为特征
.
单元格
.
2020
;
182
:
1419
1440
.

8

T。
,
韦伯
K.G.I.公司。
,
麦迪森·约翰斯顿
美国。
,
博克韦格
H。
,
林格伦
客户经理。
,
年。
,
尼德格尔
答:。
,
十、。
,
总经理。
,
贾亚通
D。
等。
前体共分离的数据依赖性采集提高了无标签单细胞蛋白质组学的蛋白质组覆盖率和测量吞吐量
.
安圭。化学。
2023
;
62
:
e202303415号
.

9

穆德
答:。
,
布伦纳
公元
,
曼恩
M。
组织中具有单细胞分辨率的无偏空间蛋白质组学
.
分子电池
.
2022
;
82
:
2335
2349
.

10

规格
H。
,
埃莫特
E.公司。
,
佩泰尔斯基
答:。
,
哈夫曼
钢筋混凝土。
,
帕尔曼
D.H.公司。
,
塞拉
M。
,
哈尔琴科
第页。
,
科勒
答:。
,
斯拉沃夫
N。
使用SCoPE2对巨噬细胞异质性进行单细胞蛋白质组学和转录组学分析
.
基因组生物学。
2021
;
22
:
50
.

11

伦巴第-巴奈克
C、。
,
穆迪
南非。
,
曼齐尼
M.C.公司。
,
尼姆(Nemes)
第页。
微取样毛细管电泳质谱技术使复杂组织中的单细胞蛋白质组学成为可能:非洲爪蟾和斑马鱼活胚胎中的细胞克隆
.
分析。化学。
2019
;
91
:
4797
4805
.

12

施特尔策
内部审计。
,
盖米
医学硕士。
,
十、。
,
安藤
英国。
,
河豆
J.J.公司。
,
费耶茨
D。
,
彼得森
L.S.公司。
,
谣言
好的。
,
E.S.公司。
,
加尼奥
E.A.公司。
等。
母亲代谢组、蛋白质组和免疫组的综合轨迹预测分娩开始
.
科学。Transl.公司。医学。
2021
;
13
:
eabd9898型
.

13

科尔内伊
J。
,
吊架
V.A.公司。
,
特林夸特
L。
,
让开
D。
,
普赖斯
S.R.公司。
,
本杰明
E.J.公司。
,
H。
多组学方法中的新生物标记物:改善心房颤动的风险预测
.
心血管疾病。物件。
2021
;
117
:
1632
1644
.

14

H。
,
F。
,
十、。
,
年。
,
N。
,
C、。
,
H。
,
R。
综合蛋白质组学和单细胞质量细胞术分析剖析强直性脊柱炎的免疫景观
.
分析。化学。
2023
;
95
:
7702
7714
.

15

塔吉克语
M。
,
巴哈法尔
M。
,
唐纳德
W.A.公司。
单细胞质谱
.
生物技术趋势。
2022
;
40
:
1374
1392
.

16

巴德尼克
B。
,
征收
E.公司。
,
哈曼热
G.公司。
,
斯拉沃夫
N。
SCoPE-MS:单个哺乳动物细胞的质谱定量细胞分化过程中的蛋白质组异质性
.
基因组生物学。
2018
;
19
:
161
.

17

佩克尔
J.M.公司。
单细胞蛋白质组学占据中心地位
.
自然
.
2021
;
597
:
580
582
.

18

拉比卜
M。
,
凯利
S.O.公司。
针对蛋白质组的单细胞分析
.
自然修订版化学。
2020
;
4
:
143
158
.

19

克兰尼
C.W.公司。
,
迈耶
J.G.公司。
用于直接输注鸟枪蛋白质组分析的CsoDIAq软件
.
分析。化学。
2021
;
93
:
12312
12319
.

20

H。
,
希马利
J.J.公司。
,
萨蒂萨巴尔
C.L.公司。
,
贝塞尔
美国科学院。
,
征收
D。
,
本杰明
E.J.公司。
,
冈萨雷斯
医学硕士。
,
高希
美国。
,
瓦桑
相对应力。
,
塞沙德里
美国。
等。
在弗雷明翰心脏研究中使用机器学习方法识别痴呆症的血液生物标志物
.
细胞
.
2022
;
11
:
1506
.

21

M。
,
卡弗
J。
,
希瓦
C、。
,
Tzouros公司
M。
,
T。
,
T.H.公司。
,
普尔曼
B。
,
伯恩哈特
O.M.公司。
,
Huttenhain公司
R。
,
特奥
总承包商。
等。
MassIVE.quant:基于质谱的定量蛋白质组学数据集的社区资源
.
自然方法
.
2020
;
17
:
981
984
.

22

B。
,
卢内塔
K.L.公司。
,
杜普伊斯
J。
,
卢比茨
南非。
,
特林夸特
L。
,
姚明
L。
,
埃利诺
P.T.公司。
,
本杰明
E.J.公司。
,
H。
整合组学方法鉴定心房颤动相关基因
.
循环。物件。
2020
;
126
:
350
360
.

23

年。
,
R。
,
J。
,
西。
,
B。
,
线路接口单元
J。
,
十、。
,
美国。
单细胞测序在癌症研究中的应用:进展与展望
.
《血液学杂志》。昂科尔。
2021
;
14
:
91
.

24

K.L.公司。
,
起重机
医学硕士。
,
凯伯林
M。
用于酵母复制寿命研究的微流体技术
.
机械。老龄化发展。
2017
;
161
:
262
269
.

25

科彻
英国。
,
Delot-Vilain公司
答:。
,
斯宾塞
D。
,
洛坦皮奥
J。
,
德洛
E.C.公司。
新冠肺炎疫情公开可用的性别分类数据的缺乏和差异阻碍了循证决策
.
架构(architecture)。性别。贝哈夫。
2021
;
50
:
407
426
.

26

迪金森
问:。
,
Aufschnaiter公司
答:。
,
奥特
M。
,
迈耶
J.G.公司。
通过机器学习实现多麦克风集成(MIMaL)
.
生物信息学
.
2022
;
38
:
4908
4918
.

27

灰色
G.K.(通用)。
,
客户经理。
,
罗森布卢特
J.M.公司。
,
塞尔福斯
L.M.有限公司。
,
吉尔纽斯
N。
,
J.R.公司。
,
沙克曼
钢筋混凝土。
,
W.L.公司。
,
摩尔
英国。
,
夏皮罗
香港。
等。
整合单细胞蛋白质组学和转录组学的人类乳腺图谱
.
开发单元
.
2022
;
57
:
1400
1420
.

28

J。
,
Hyeon公司
D.Y.公司。
,
黄星京
D类
单细胞多组学:技术和数据分析方法
.
实验摩尔浓度。
2020
;
52
:
1428
1442
.

29

C、。
,
苗族
十、。
,
B。
,
托马斯
R.J.公司。
,
里韦罗
A.H.公司。
,
布兰特
有限责任公司。
,
里韦罗
A.L.P.公司。
,
H。
生活方式与深度学习预测心电图年龄的相关性
.
前面。心血管疾病。医学。
2023
;
10
:
1160091
.

30

赫丁
F。
,
康斯坦丁诺
M。
,
科斯马
答:。
复杂数据集细胞术后分析的数据集成和可视化技术
.
细胞计量学A
.
2021
;
99
:
930
938
.

31

朔夫
E.M.公司。
,
富特旺勒
B。
,
尿素酶
N。
,
拉宾
N。
,
萨维科斯
美国。
,
Gentil公司
C、。
,
勒奇曼
E.公司。
,
凯勒
阿联酋。
,
迪克
J.E.公司。
,
波尔斯
B.T.公司。
定量单细胞蛋白质组学作为表征细胞层次结构的工具
.
国家公社。
2021
;
12
:
3341
.

32

观景台
L.F.有限责任公司。
,
泰伊
美国。
单细胞蛋白质组学
.
趋势生物化学。科学。
2021
;
46
:
661
672
.

33

德国
E.W.公司。
,
班德拉
N。
,
夏尔马
五、。
,
Perez-Riverol公司
年。
,
卡弗
J.J.公司。
,
昆都
D.J.公司。
,
加西亚-塞塞德斯
D。
,
雅努克(Jarnuczak)
空军。
,
赫瓦帕提拉纳
美国。
,
普尔曼
英国标准。
等。
2020年蛋白质组X变化联盟:在蛋白质组学中实现大数据方法
.
核酸研究。
2020
;
48
:
D1145号
D1152号
.

34

佩雷斯·里韦罗
年。
,
J。
,
班德拉
C、。
,
加西亚-塞塞德斯
D。
,
赫瓦帕迪拉纳
美国。
,
卡马奇纳坦
美国。
,
昆都
D.J.公司。
,
普拉卡什
答:。
,
Frericks拉链
答:。
,
艾泽纳赫
M。
等。
2022年的PRIDE数据库资源:基于质谱的蛋白质组学证据中心
.
核酸研究。
2022
;
50
:
D543型
D552型
.

35

森雅
年。
,
河曲
美国。
,
奥田
美国。
,
瓦塔纳贝
年。
,
松本
M。
,
高美
T。
,
小林寺
D。
,
山口县
年。
,
荒木经惟
N。
,
吉泽一郎
交流。
等。
jPOST环境:集成蛋白质组学数据存储库和数据库
.
核酸研究。
2019
;
47
:
D1218型
D1224号
.

36

T。
,
妈妈
J。
,
线路接口单元
年。
,
Z.公司。
,
N。
,
年。
,
年。
,
C、。
,
M。
,
美国。
等。
2021年iProX:将蛋白质组学数据共享与大数据连接起来
.
核酸研究。
2022
;
50
:
D1522型
D1527型
.

37

夏尔马
五、。
,
埃克尔斯
J。
,
先令
B。
,
路德维希
C、。
,
杰菲
J.D.(医学博士)。
,
MacCos公司
医学博士。
,
麦克莱恩
B。
全景公共:天际线中处理的定量数据集的公共存储库
.
分子细胞。蛋白质组学
.
2018
;
17
:
1239
1244
.

38

法拉
T。
,
德国
E.W.公司。
,
克雷斯伯格
R。
,
太阳
Z.公司。
,
坎贝尔
D.S.公司。
,
门多萨
L。
,
库斯巴赫
美国。
,
布鲁斯尼亚克
M.Y.先生。
,
Huttenhain公司
R。
,
席斯
R。
等。
PASSEL:肽图谱srm实验文库
.
蛋白质组学
.
2012
;
12
:
1170
1175
.

39

蜘蛛侠
J。
,
布鲁尔
英国。
,
罗森博格
C、。
,
科特卡
N。
,
布林克曼
钢筋。
FlowRepository:与同行评审出版物相关的注释流式细胞术数据集资源
.
细胞计量学A
.
2012
;
81
:
727
731
.

40

巴塔查里亚
美国。
,
邓恩
第页。
,
托马斯
C.G.公司。
,
史密斯
B。
,
谢弗
H。
,
J。
,
Z.公司。
,
扎洛库斯基
K.A.公司。
,
尚卡尔
钢筋混凝土。
,
Shen-Orr公司
S.S.公司。
等。
ImmPort,致力于将开放存取免疫分析数据重新用于转化和临床研究
.
科学。数据
.
2018
;
5
:
180015
.

41

总工程师。
,
科特卡
N。
Cytobank:为社区细胞术数据分析和协作提供分析平台
.
货币。顶部。微生物。免疫学。
2014
;
377
:
127
157
.

42

M。
,
德比郡
M.K.医学博士。
,
山下
注册会计师。
,
马歇尔·鲍尔
答:。
NCBI的保守域数据库和蛋白质域分析工具
.
货币。协议。生物信息学
.
2020
;
69
:
e90(电子90)
.

43

万德拉
C、。
,
加托
L。
单细胞蛋白质组学数据的复制揭示了重要的计算挑战
.
蛋白质组学专家版
.
2021
;
18
:
835
843
.

44

吉尔
L.Y公司。
,
拉宾
J。
,
斯洛塔
D.J.公司。
,
马克
财政部。
,
斯坦因
瑞典。
AI组学:利用人工智能扩展的质谱库探索更多的蛋白质组
.
蛋白质组研究杂志。
2023
;
22
:
2246
2255
.

45

费尔南德斯
D.M.公司。
,
拉赫曼
A.H.公司。
,
费尔南德斯
abbr.国家处方集
,
丘德诺夫斯基
答:。
,
阿米尔
E.D.公司。
,
阿马多里
L。
,
可汗
不适用。
,
Wong(王)
C.K.公司。
,
沙迈洛娃
R。
,
希尔
首席执行官。
等。
人类动脉粥样硬化斑块的单细胞免疫景观
.
自然医学。
2019
;
25
:
1576
1588
.

46

拉文
年。
,
小林寺
美国。
,
领导者
答:。
,
阿米尔
E.D.公司。
,
埃莱凡特
N。
,
比根瓦尔德
C、。
,
备注
R。
,
斯威尼
R。
,
贝克尔
客户尽职调查。
,
莱文
J.H.公司。
等。
配对单细胞分析早期肺腺癌的先天免疫状况
.
单元格
.
2017
;
169
:
750
765
.

47

帕利
C.G.公司。
,
问:。
,
吉莱斯皮
文学硕士。
,
香农
第页。
,
Mazurczyk公司
M。
,
纳波利塔尼
G.公司。
,
价格
未注明。
,
拉尼什
J.A.公司。
,
莫里西
E.公司。
,
希格斯粒子
D.R.公司。
等。
单细胞蛋白质组学表明,共同表达的谱系特异性转录因子的数量变化决定了细胞命运
.
细胞干细胞
.
2019
;
24
:
812
820
.

48

Mahdesian女士
D。
,
塞斯尼克
A.J.公司。
,
格南
C、。
,
丹尼尔松
F。
,
斯坦斯特罗姆
L。
,
阿里夫
M。
,
C、。
,
T。
,
约翰逊
F。
,
舒顿
R。
等。
单细胞蛋白基因组学对细胞周期的时空解剖
.
自然
.
2021
;
590
:
649
654
.

49

年。
,
太阳
H。
,
十、。
,
J。
,
F。
ANPELA:基于细胞分析的单细胞蛋白质组学的显著增强量化工具
.
高级科学。(威恩)
.
2023
;
10
:
e2207061号
.

50

贝罗奇
答:。
纤维龙,一种细胞系知识资源
.
《生物分子杂志》。技术。
2018
;
29
:
25
38
.

51

L。
,
顶点
答:。
探索细胞异质性的单细胞质谱方法
.
安圭。化学。
2018
;
57
:
4466
4477
.

52

科尔泰卡
C、。
,
克尔萨科娃
G.公司。
,
斯泰斯卡尔
英国。
,
彭宁格
J.M.公司。
,
门让
美国。
,
梅希特勒
英国。
,
斯塔德曼
J。
通过多重数据依赖性采集比较微量样品的蛋白质组特征
.
分子细胞。蛋白质组学
.
2022
;
21
:
100177
.

53

年。
,
皮埃霍夫斯基
P.D.公司。
,
R。
,
J。
,
年。
,
摩尔
R.J.公司。
,
舒克拉
英国。
,
佩图克
V.A.公司。
,
坎贝尔-汤普森
M。
,
马修斯
首席执行官。
等。
纳米液滴处理平台用于10-100个哺乳动物细胞的深层定量蛋白质组分析
.
国家公社。
2018
;
9
:
882
.

54

团队FlowJo
适用于Windows的FlowJo™软件,版本10.8
.
2021
;
俄勒冈州阿什兰
Becton、Dickinson和公司
.

55

摩纳哥
G.公司。
,
H。
,
波伊丁格
M。
,
J.M.公司。
,
德马加拉斯
J.P.公司。
,
拉尔维
答:。
flowAI:流式细胞术数据的自动交互式异常识别工具
.
生物信息学
.
2016
;
32
:
2473
2480
.

56

Cosma公司
答:。
单个细胞的噩梦:成为一个双重细胞
.
细胞计量学A
.
2020
;
97
:
768
771
.

57

克莱默
K.J.公司。
,
威尔丰
E.M.公司。
,
沃斯
英国。
,
男爵
S.M.公司。
,
什亚科拉斯
阿拉伯联合酋长国。
,
拉朱
N。
,
罗伊
首席执行官。
,
苏里亚德瓦拉
N。
,
散步的人
L.M.有限公司。
,
墙壁
S.C.公司。
等。
BNT162b2 SARS-CoV-2 RNA疫苗抗原特异性反应的单细胞分析
.
国家公社。
2022
;
13
:
3466
.

58

德瓦尔加斯·罗迪蒂
L。
,
雅各布斯
答:。
,
鲁埃斯科夫
J.H.公司。
,
银行主管
第页。
,
雪佛莱
美国。
,
杰克逊
高压水。
,
赫尔曼斯
T。
,
Fankhauser公司
客户尽职调查。
,
普瓦耶
C、。
,
F。
等。
单细胞蛋白质组学定义了局限性前列腺癌的细胞异质性
.
细胞代表医学。
2022
;
:
100604
.

59

H。
,
M。
,
G.公司。
,
L。
,
西。
,
Z.公司。
,
F。
SoCube:一种用于分析scRNA-seq数据的创新端到端双重检测算法
.
生物信息简介。
2023
;
24
:
英国广播公司104
.

60

蒂亚诺娃
美国。
,
特姆
T。
,
考克斯
J。
基于质谱的鸟枪蛋白质组学MaxQuant计算平台
.
《国家协议》。
2016
;
11
:
2301
2319
.

61

蒂亚诺娃
美国。
,
特姆
T。
,
西尼琴
第页。
,
卡尔森
答:。
,
海因
M.Y.先生。
,
盖革
T。
,
曼恩
M。
,
考克斯
J。
用于(蛋白质)组学数据综合分析的Perseus计算平台
.
自然方法
.
2016
;
13
:
731
740
.

62

求爱
J。
,
威廉姆斯
S.M.公司。
,
马基利
L.M.有限公司。
,
美国。
,
成本加运费。
,
阿奎列拉·瓦兹奎兹
五、。
,
桑塔格
相对湿度。
,
摩尔
R.J.公司。
,
D。
,
梅塔
H.S.公司。
等。
使用嵌套纳米孔芯片进行单细胞蛋白质组学的高通量高效样品制备
.
国家公社。
2021
;
12
:
6246
.

63

UniProt公司
C、。
UniProt:2023年通用蛋白质知识库
.
核酸研究。
2023
;
51
:
D523型
D531型
.

64

费德亨
美国。
在NCBI分类数据库中键入材料
.
核酸研究。
2015
;
43
:
D1086号
D1098号
.

65

柳叶刀
T。
ICD-11接口
.
柳叶刀
.
2019
;
393
:
2275
.

66

基姆
美国。
,
J。
,
T。
,
金杜利特
答:。
,
J。
,
美国。
,
问:。
,
鞋匠
文学学士。
,
蒂森
私人助理。
,
B。
等。
PubChem 2023更新
.
核酸研究。
2023
;
51
:
D1373号
D1380型
.

67

卡内希萨
M。
,
古道
M。
,
佐藤
年。
,
川岛
M。
,
Ishiguro-Watanabe公司
M。
KEGG用于基于分类学的路径和基因组分析
.
核酸研究。
2023
;
51
:
D587型
D592型
.

68

年。
,
美国。
,
F。
,
年。
,
年。
,
Z.公司。
,
R。
,
J。
,
年。
,
棕褐色
年。
等。
2020年治疗目标数据库:丰富资源,促进靶向治疗的研究和早期开发
.
核酸研究。
2020
;
48
:
D1031号
D1041号
.

69

F。
,
J。
,
M。
,
M。
,
Z.公司。
,
Z.公司。
,
棕褐色
年。
,
美国。
,
十、。
,
H。
等。
DrugMAP:所有药物的分子图谱和药物信息
.
核酸研究。
2023
;
51
:
第1288天
D1299号
.

70

美国。
,
J。
,
奇萨(Chitsaz)
F。
,
德比郡
M.K.医学博士。
,
吉尔
钢筋混凝土。
,
冈萨雷斯
不适用。
,
瓜兹
M。
,
赫尔维茨
D.I.公司。
,
马尔克勒
G.H.公司。
,
歌曲
J.S.公司。
等。
CDD/SPARCLE:2020年的保守领域数据库
.
核酸研究。
2020
;
48
:
D265型
D268型
.

71

H。
,
J。
,
G.公司。
,
J。
,
十、。
,
J。
,
年。
,
D。
,
D。
,
T。
CovalentInDB:促进发现共价抑制剂的综合数据库
.
核酸研究。
2021
;
49
:
D1122号
D1129号
.

72

太阳
十、。
,
年。
,
H。
,
年。
,
美国。
,
Z.公司。
,
十、。
,
H。
,
F。
,
J。
等。
DRESIS:首个全面的耐药信息景观
.
核酸研究。
2023
;
51
:
D1263型
D1275号
.

73

T。
,
F。
,
年。
,
J。
,
西。
,
十、。
,
线路接口单元
十、。
,
Xin(新)
西。
,
C、。
,
L。
等。
VARIDT 2.0:药物转运蛋白的结构变异性
.
核酸研究。
2022
;
50
:
第1417天
D1431号
.

74

哈丁
S.D.公司。
,
阿姆斯特朗
J.F.公司。
,
法琴达
E.公司。
,
Southan公司
C、。
,
亚力山大
S.P.H.公司。
,
达文波特
A.P.公司。
,
帕森
A.J.公司。
,
加速
M。
,
戴维斯
J.A.公司。
,
编号
一、。
2022年IUPHAR/BPS药理学指南:新冠肺炎、疟疾和抗菌药物的药理学策划
.
核酸研究。
2022
;
50
:
D1282号
D1294号
.

75

西。
,
奥尼尔
K.R.公司。
,
哈夫特
D.H.公司。
,
迪库乔
M。
,
切特弗宁
五、。
,
巴德雷丁
答:。
,
库洛里斯
G.公司。
,
奇萨(Chitsaz)
F。
,
德比郡
M.K.医学博士。
,
杜尔金
美国科学院。
等。
RefSeq:通过蛋白家族模型管理扩大原核基因组注释管道范围
.
核酸研究。
2021
;
49
:
D1020号
D1028号
.

作者注释

作者希望大家知道,在他们看来,前三位作者应被视为联合第一作者。

这是一篇根据知识共享署名-非商业许可条款发布的开放存取文章(https://creativecommons.org/licenses/by-nc/4.0/)它允许在任何媒体上进行非商业性重复使用、分发和复制,前提是正确引用了原始作品。如需商业重复使用,请联系journals.permissions@oup.com

评论

0条评论
提交评论
您输入了无效代码
感谢您对本文发表评论。您的评论将由杂志自行审查并发表。请通过电子邮件查看更多通知。