摘要
长非编码RNA(lncRNAs)具有广泛的生物学功能,研究表明其在调节发育、分化和免疫反应等主要生物过程中具有重要意义。lncRNA研究的加速积累大大扩展了我们对lncRNA功能的理解。在这里,我们介绍LncSEA 2.0(http://bio.liclab.net/LncSEA/index.php)旨在提供一套更全面的功能性lncRNAs并增强浓缩分析能力。与LncSEA 1.0相比,我们做了以下改进:(i)我们更新了11类lncRNA集合,并极大地扩展了每个集合的lncRNA范围。(ii)我们从多种资源中新引入了15个功能性lncRNA类别。这一更新不仅包括大量lncRNAs下游调控数据,还涵盖了许多表观遗传调控数据集,包括lncRNA-相关转录辅因子结合、染色质调节器结合和染色质相互作用数据。(iii)我们基于GSEA和GSVA合并了两个新的lncRNA集富集分析功能。(iv)我们采用蛇纹分析管道来跟踪数据处理和分析。总之,LncSEA 2.0提供了更全面的lncRNA集合集合和更多种类的富集分析模块,帮助研究人员对lncRNA的功能机制进行更全面的研究。
介绍
长非编码RNA(lncRNAs)作为分子支架、诱饵或转录调节剂调节基因表达水平,在发育、分化和免疫反应等众多生物过程中发挥着重要的调节作用(1). lncRNAs作为一种关键的细胞调节因子,位于细胞质和细胞核中,能够在转录前和转录后水平发挥广泛的功能。从机制上讲,核素放大的lncRNA可以与染色质或剪接因子相互作用来控制下游基因。细胞质定域lncRNAs可以作为竞争性内源性RNAs(ceRNAs)或相互作用物来调节基因表达。例如,HOTTIP可以与WDR5-MLL复合物相互作用,激活HOXA基因簇5′端的基因转录(2). ANRASSF1可以形成R-环结构,募集PRC2复合物,并使RASSF1A基因沉默,参与乳腺癌和前列腺癌的发生。GUARDIN能与BRCA1和BARD1蛋白相互作用,稳定BRCA1蛋白,促进DNA修复,抑制结肠癌细胞凋亡和衰老(三). 新的证据表明,lncRNAs在调节肿瘤免疫状态中发挥着关键作用。研究发现,lncRNA可以通过调节T细胞亚群对细胞凋亡的易感性来改变肿瘤微环境中T细胞亚群的平衡,从而提出了一种新的肿瘤免疫逃避机制(4). 此外,lncRNA可通过影响糖代谢、脂代谢、氨基酸代谢和线粒体功能,影响免疫代谢相关疾病的发生和发展,如病毒感染、肥胖、糖尿病和动脉粥样硬化(5). 此外,lncRNAs已被证明与癌症的发生、发展和转移有关。MALAT1、HOTAIR和H19等LncRNAs在多种癌症中表现出异常表达模式,包括肺癌、乳腺癌和结直肠癌(6). 这些失调的lncRNAs可以促进癌细胞增殖,破坏平衡的肿瘤微环境,加速肿瘤生长和转移。随着对lncRNA机制的深入研究,人们提出了更多lncRNA的调节作用。LncRNAs可以与染色质内的DNA和蛋白质相互作用,从而促进或抑制靶DNA区域内的蛋白质结合活性。除了与DNA和染色质内蛋白质的相互作用外,lncRNA还依赖蛋白质介导的远端染色质相互作用来发挥其调节作用。CCCTC-结合因子(CTCF)等蛋白质在介导这些相互作用中起着关键作用。lncRNAs通过促进长距离染色质环并使远端调控元件(例如远端增强子)更靠近靶基因启动子,可以直接增强其影响特定靶基因转录活性的能力。(7). 大量研究表明,转录调控程序中的主要调节器是转录因子(TF)、转录辅因子(TcoF)和染色质调节器(CR)。TF通常与特定DNA结合顺式-连接远端或近端调节线索的调节元件,通过招募协同转录调节器调节lncRNA表达。例如,实验证实SMARCA4作为一种抑制上游染色质重塑因子和心脏特异性lncRNA Mhrt的TcoF发挥作用,从而促进心肌肥厚和心力衰竭的发展(8). 同时,N6-甲基腺苷(m6A)修饰是细胞生物学中最先进的机制之一。研究表明,m6A修饰是lncRNA-MALAT1在肿瘤转移中作用的关键因素。具体地说,当lncRNA-MALAT1经过m6A修饰后,YTHDC1可以识别lncRNA-MALAT1的修饰位点,导致核斑点蛋白组成的重组,进而促进邻近癌基因的表达,从而促进肿瘤转移(9). 此外,已发现m6A诱导的lncRNA-RP11通过上调Zeb1而触发CRC细胞的迁移和增殖(10). 总结lncRNA的所有这些调控作用或功能有助于全面了解lncRNA相关的调控格局。
近年来,研究人员开发了多种与lncRNAs相关的数据库,如EVLncRNAs(11)、MNDR(12),LncRNAWiki(13),lncRNA疾病(14)和Lnc2癌症(15)记录了详细的lncRNA基本注释信息和lncRNA相关疾病表型信息。此外,RNAInter(16),N品脱(17)和ENCORI(18)重点提供有关RNA-RNA和蛋白质-RNA相互作用的信息。ImmReg公司(19),InnateDB(20)和ImmPort(21)提供有关lncRNA在癌症免疫学中调节作用的信息。这些数据库是研究lncRNA相关调控轴的宝贵资源。然而,所有这些lncRNA相关的注释信息和调控信息都分布在众多资源中,缺乏全面的lncRNA列表和lncRNA功能分类。随着对人类疾病和生物过程的lncRNA相关研究的不断增加,由于高通量或低通量实验产生和积累了大量功能性lncRNA,因此迫切需要对人类lncRNA进行全面的收集和分类。2020年,我们开发了LncSEA 1.0,为用户提供各种类型的lncRNA集合,并支持lncRNA注释和富集分析。通过lncRNA富集分析,用户可以预测与不同功能lncRNA集相对应的特定细胞、组织和疾病类型,并分析其在调节基因表达和细胞功能方面的潜在作用。富集分析也有助于发现lncRNA与其他上游转录调节因子(如TF、TcoFs和CR)之间的相互作用网络。此外,自LncSEA 1.0发布以来,不断发现更多的lncRNA功能数据集,为探索lncRNA的潜在功能提供了有价值的信息。因此,迫切需要进一步整合这些积累的大规模数据集,以探索lncRNA的功能和生物学意义,为进一步研究lncRNA相关分子机制和治疗应用提供调控线索。
我们介绍了LncSEA 2.0,这是一个更新和大幅扩展的平台,支持超过400000个参考lncRNA集合,包括33个类别和86个子类别,涵盖了超过200000个lncRNA。值得注意的是,与LncSEA 1.0相比,LncSEA2.0中的lncRNA集合数据量显著增加。除了LncSEA 1.0提供的基因集富集算法外,LncSEA2.0还添加了更高级的富集分析,包括GSEA(22)和GSVA(23). LncSEA 2.0不仅从下游调控数据源中筛选出lncRNA集合,而且通过整合数百种人类细胞类型的ChIP-seq、DNase-seq,ATAC-seq和H3K27ac ChIP-se数据,计算出大量受上游转录调节器和DNA调控元件调控的lncRNA集。LncSEA 2.0为与上游调控元件和下游靶点相关的lncRNA集提供注释和富集分析功能。此外,LncSEA 2.0还提供了一个用户友好的界面,用于搜索、浏览和可视化有关这些lncRNA集合的详细信息。总之,LncSEA 2.0是一个强大的平台,为用户提供各种类型的lncRNA集合,并支持lncRNA注释和富集分析功能。
数据扩展和预处理
标准化和可扩展的数据处理工作流
与LncSEA 1.0相比,LncSEA2.0改进了lncRNA集合的收集和处理工作流。高级蛇形(24)LncSEA 2.0采用框架来规范大规模公共lncRNA相关数据的处理。我们将数据组织为多个类别,每个类别包含多个子类别。对于每个子类别,我们都创建了独立的脚本,以促进处理,最小化代码耦合,并显著增强数据可伸缩性。利用最新的处理流程,LncSEA 2.0已经处理了40多万个参考lncRNA集合,涵盖33个类别(包括突变、癌症免疫学、肿瘤转移、ceRNAs、染色质相互作用、RNA-RNA相互作用、RNA蛋白相互作用、核糖核酸染色质修饰、RNA化合物、组织中的空间表达、癌症功能状态、疾病类型、m6A修饰、实验验证的功能、细胞标记、保存、eQTL、exosomes、炎症、SmORF、甲基化模式、基因破坏、亚细胞定位、存活、药物、转录辅助因子、剪接事件、染色质调节因子)和86个子类别。
lncRNA参考集的收集和处理
LncSEA2.0在数据量和类别以及重新分类的收集类型方面都有了显著的扩展。简而言之,LncSEA 2.0新增了来自不同来源的lncRNA相关参考数据集,包括大量高通量和低高通量验证数据集,以及生物信息学算法预测的lncRNA集(图1). 我们还从更新的或附加的数据源中扩展了LncSEA 1.0的lncRNA集。例如,我们已使用Lnc2Cancer 3.0、EVlncRNAs 2.0和ENCORI等相应数据库中的数据更新了疾病类别,这些数据库自LncSEA 1.0发布以来就已可用。
![数据库内容和结构。LncSEA 2.0不仅更新了原始数据集,还收集了更多可用的lncRNA集资源。LncSEA 2.0包括浏览、搜索、下载和可视化lncRNA集合的功能,并支持多种lncRNA集富集功能。](https://oup.silverchair-cdn.com/oup/backfile/Content_public/Journal/nar/52/D1/10.1093_nar_gkad1008/1/m_gkad1008fig1.jpeg?Expires=1721185615&Signature=CzGJJTZqNkEhbrNK9e5XYb6PT-ASS0lXjVVbqUQaX60~FGE6LGJyoqHrCHRCGTlA3NOXt~nCwspuIv6X6LUGABUOmobs4SQPl0W-dFP-vW0UQboFrSKxlRgk3z2~Mru1TQ-BqMz11FT2~6JAh769jGtjFpiJb5S9kTW8863NCeUj1qCkjAeewycwpjIheqOy5pMyQOgA1ddhw-pvnHF7TKpmrtztfY59jlxsdyjeRxXsyfLhXjQnH41v-Sry~ZAMiGMJzGbbcyB8ZaIHHljg~grr5cjD914o~a2DVNgQL-Bcv78jk91ovWhTp5HmQiilPW0jCex65XlqKILC~g5UGw__&Key-Pair-Id=APKAIE5G5CRDK6RD3PGA)
图1。
数据库内容和结构。LncSEA 2.0不仅更新了原始数据集,还收集了更多可用的lncRNA集资源。LncSEA 2.0包括浏览、搜索、下载和可视化lncRNA集合的功能,并支持多种lncRNA集富集功能。
对于背景lncRNA列表,我们使用了来自多个来源的lncRNA集合,包括LncSEA 1.0、NONCODE 6.0和GENCODE。所有lncRNAs参考集的识别是使用这个综合背景lncRNAs数据集进行的。用于收集和处理新添加类别的lncRNA集合的策略和具体方案描述如下:
染色质相互作用
研究表明,具有染色质相互作用的基因组区域可以产生丰富的lncRNA,如增强子RNA,以调节下游基因的转录。这种机制可以帮助发现lncRNA与其位于同一染色体中的靶基因之间的相互作用。因此,我们从OncoBase收集了染色质相互作用数据(25)通过筛选lncRNA-基因对获得一组潜在的lncRNA靶基因。
实验验证功能
LncRNAs被认为是疾病的关键调节因子,并已被证明通过多种生物功能参与病理过程,如细胞增殖、凋亡和细胞转移。我们从LncTarD2.0下载了所有实验支持的lncRNA调节功能关系(26)收集了疾病相关lncRNA和lncRNA介导的人类疾病调控机制驱动的关键靶点和重要生物功能。我们根据人类疾病中受lncRNA-介导调节影响的生物功能正(+)或负(-)来划分所有关系。
基因扰动
LncRNAs由许多上游调节器调节,如TF和其他转录调节器。抑制上游TFs的表达可以直接抑制或增强lncRNAs的转录活性。我们从KnockTF获得了高通量数据支持的TF-lncRNA关系的敲除/敲除实验(siRNA/shRNA/CRISPR)(27). 我们根据不同的TF扰动数据集按TF名称划分lncRNA集。
免疫
免疫系统中异常的基因调控模式被认为是各种癌症发生的主要原因。lncRNA相关潜在调节剂的鉴定和表征对癌症免疫治疗至关重要。从ImmPort收集lncRNA相关免疫功能(21)InnateDB的免疫相关GO术语和ImmReg的免疫相关通路和细胞(19). 我们还从TCGA中获得了癌症免疫相关的lncRNA(28)使用Cibersort软件的队列(29). 我们根据免疫相关功能和表型将所有这些lncRNA分为5类,包括基因本体(GO)(30),途径,功能,细胞和癌症。
炎症
炎症被认为是多种疾病(如癌症和心血管疾病)发生、发展和结局的主要原因。最近的研究表明,lncRNAs可以调节炎症因子,如细胞因子和趋化因子,参与免疫系统的调节过程并参与免疫治疗。我们从ncRI下载了所有经实验验证的lncRNA-炎症疾病关系(31).
突变
lncRNAs中发生的突变已被证明在癌症发展中起着重要作用。突变可以破坏lncRNA的RNA二级结构,影响其分子功能和表达模式。lncRNAs表达及其突变的变化促进肿瘤的发生和转移。因此,我们从TCGA和ICGC收集了lncRNA相关突变的数据(32)分别是。
RNA化合物
LncRNAs已被证明具有结合化合物的能力。在这里,我们从RNAinter数据库中收集了所有lncRNA-复合物对。我们根据不同的化合物名称划分lncRNA集合。
RNA相关组蛋白修饰
大量研究表明,lncRNAs可以结合组蛋白参与基因转录调控。在这里,我们从RNAinter数据库中收集了lncRNA组蛋白修饰蛋白对。我们总共列出了48种组蛋白修饰蛋白,如H3K27ac、H3K4me1和H3K17me3。
组织空间表达
LncRNA跨组织的空间表达模式对于揭示或研究不同组织中的LncRNA功能很重要。更重要的是,lncRNA空间表达模式为疾病机制和组织特异性治疗靶点提供了重要的生物学线索。我们从lncSpA下载了lncRNA-组织关系(33)旨在提供人体38种不同正常组织、33种成人癌症类型和7种儿童癌症类型lncRNA表达的空间图谱。我们根据组织名称划分了所有的空间表达模式。
转录辅因子
大量研究表明,转录调控程序中的主要调节因子是TF、转录辅因子(TcoFs)和染色质调节因子(CR)。TF通常以合作的方式与远端DNA元件结合,通过招募相互作用的TcoF来调节基因表达。在这里,我们收集了来自TcoFBase的基因表达推断/TcoF-ChIP-seq/实验验证的TcoF-lncRNA关系(34). 我们根据TcoF名称定义了lncRNA集。
肿瘤转移
大量研究表明,lncRNAs是各种癌症转移事件中的关键调节因子或生物标记物,如癌细胞侵袭、灌注、外渗和增殖,它们可以协同促进恶性肿瘤扩散并导致大量患者死亡。这里,我们从lncRNAWiki 2.0中收集了lncRNA-肿瘤转移事件或癌症类型(13)和LncR2metata(35).
ceRNA
CeRNA是lncRNA的一种被广泛研究的机制。根据ceRNA理论,lncRNAs可以竞争性地海绵内源性miRNAs,以挽救下游mRNAs的降解。作为miRNA海绵,lncRNA在不同的组织或细胞中发挥着重要作用。因此,我们将ceRNA pars分为三类,分别命名为细胞、癌症和miRNA(36)和LncACTdb3.0(37).
m6A修改
m6A是真核RNA中最丰富的内源性化学修饰。大量研究表明,异常的m6A修饰是肿瘤发生和发展的关键,如乳腺癌、肺癌、急性髓细胞白血病和肝细胞癌。m6A修饰对RNA的丰度和影响取决于不同类型调控因子之间的复杂相互作用,包括甲基转移酶(“writers”)、RNA结合蛋白(“readers”)和去甲基酶(“rasers”)。了解这些不同的m6A调节因子可以极大地增加我们对RNA甲基化在基因表达调控和各种生物过程中的作用的了解。这里,我们收集了M6A2Target的m6A修改(38).
拼接事件
以前的研究表明,不同亚型的lncRNAs在肿瘤发生中表现出不同甚至相反的功能。特定癌症类型中lncRNA的首选剪接模式有助于探索非编码序列的模块功能。我们从LncAS2Cancer下载了30多种癌症类型的所有lncRNA相关剪接事件(39). 我们将所有lncRNA相关剪接事件分为8种类型,包括跳过外显子(SE)、选择性5′剪接位点(A5SS)、选择性3′剪接部位(A3SS)、保留内含子(RI)、互斥外显子、选择性转录起始位点(altTSS)、选择性转录终止位点(altTTS)和六种不同方法(rMATS)的复杂拼接(ComplexAS)(40),马基克(41),海星(42),达帕斯(43),供应商2(44)和BRIE(45)).
染色质调节器
CR是表观遗传学的关键上游调控因子,它可以通过调节组蛋白修饰和染色质重塑来控制基因转录。根据在表观遗传学中的调节作用,CR通常分为三大类:DNA甲基化物、组蛋白修饰物和染色质重塑物。LncRNA转录受多个CR控制。在这里,我们从CRdb中收集了CR ChIP-seq支持的CR-lncRNA关系(46). 我们根据CR名称划分lncRNA集合。
此外,在中提供了所有参考文献的详细描述、方法和数据处理的软件版本补充材料和补充表S3.
数据库改进的用户界面
更新了lncRNA集合的搜索界面
LncSEA 2.0基于版本1.0改进了其搜索功能,提供了三种查询模式:“通过lncRNAs搜索”、“通过基因组区域搜索”和“通过基因组序列搜索”。其中,我们改进了基于基因组区域的查询方法。与LncSEA1.0相比,LncSEA2.0不仅提供了单区域查询,还提供了多区域查询以供用户搜索。此外,我们还优化了结果页面,显示了查询的lncRNAs的所有相关集合和基本信息。如果用户想了解有关特定lncRNA的更详细信息,可以单击lncRNA名称的超链接,该超链接将显示有关所选lncRNA更详细的信息,包括相关数据集(不显示数据的类别)以及lncRNA数据量在相关集中的分布。用户可以单击感兴趣的集合的条形图,快速跳转到显示集合名称、类别、子类别、注释信息等的相应模块。
更新的lncRNA集合浏览器
LncSEA 2.0改进了浏览页面上过滤器按钮的显示模式。与LncSEA1.0中的滚动模式相比,LncSEA2.0选择了使用分页模式。此外,在现有的选择过滤模式上,用户可以单击右上角的搜索图标执行“模糊搜索”,允许他们通过不确定的类别/子类别名称搜索相关条目。他们可以从候选列表中进一步选择筛选条件。最终过滤结果将显示在交互式表格中。更重要的是,LncSEA2.0提供了下载每个过滤操作结果的功能。
lncRNA集合的新型在线富集分析工具
LncSEA 1.0为用户提供了一种基于超几何检验的富集分析方法。在LncSEA 2.0中,我们新增了基因集富集分析(GSEA)和基因集变异分析(GSVA),用于富集lncRNA集。GSEA要求用户提供两列信息:第一列应包含lncRNA基因名称,第二列应包含基因的差异分析指标(可以是log2 fold-change(FC)或-log p-value)。通过选择相关参数和感兴趣的集合,LncSEA 2.0将显示相关集合的富集分析结果,包括汇总表和富集图。对于GSVA,用户需要提供一个以行为lncRNA、列为样本的基因表达谱。选择感兴趣的样本和相关参数后,LncSEA 2.0将显示所有样本中每个集合活动的热图,并提供浏览汇总表。同时,LncSEA 2.0提供了自定义集合大小的选项。更重要的是,LncSEA 2.0提供了所有分析结果的下载。
案例研究
LncRNAs已成为广泛研究的对象,并日益被认为是疾病治疗的潜在治疗靶点。LncRNAs可以通过多种机制参与疾病的发生和发展,包括基因表达的调节、信号转导途径的调节和染色质构象的改变。因此,研究lncRNA与疾病的关系对于发现新的临床治疗靶点具有重要意义。近年来,许多研究确定了与各种疾病相关的lncRNA,并探讨了其在疾病进展中的机制作用。通过研究lncRNA的表达模式和功能,可以发现新的疾病相关靶点,促进lncRNA相关治疗药物的开发。在这里,我们对结直肠癌(CRC)中的lncRNA进行基因集富集分析(GSEA),以验证LncSEA 2.0在癌症生物学中的能力。
首先,我们从TCGA下载并合并了结肠癌和直肠癌的lncRNA表达谱。然后我们对lncRNA进行差异表达分析,并根据FC评分对lncRNAs进行排名。然后,我们输入排名的lncRNA列表,并单击“RUN”执行GSEA。在分析界面中,左侧面板显示33个类别,包括“突变”、“RNA蛋白相互作用”、“RNA-RNA相互作用”,“肿瘤转移”、“疾病类型”、“ceRNA”等(图2安培和补充表S2). 当点击“疾病类型”时,五个“结直肠癌”集合显著丰富,分别来自MNDR3.1、LncRNAWiki 2.0、Lnc2Cancer 3.0、EVLncRNAs 2.0和NONCODE 6.0子类。通过选择“结肠癌”集合名称,加载了“结直肠癌”集合中lncRNA的所有收集细节(图2B型). 所有富集分析结果均通过气泡图、条形图和富集分数图(图2摄氏度). 此外,我们在结直肠癌中鉴定出28个核心lncRNA。例如,HAND2-AS1通过调节miR-20a抑制5-氟尿嘧啶抵抗。同时,我们还观察到miR-20a在“ceRNA”类别中的富集(24). 一些研究表明,由于ELFN1-AS1对Meis1表达的控制,靶向ELFN1-AS1的药物在细胞存活和对奥沙利铂的耐药性方面具有潜力(25). 结肠是肿瘤转移的常见部位。结肠肿瘤转移可能发生在其他器官(26). “肿瘤转移”类别的富集分析结果表明,肺部和膀胱可能发生肿瘤转移,女性也可能发生卵巢转移。
![结直肠癌lncRNAs富集分析结果。(A) “疾病”类别的结直肠癌输入数据和浓缩分析结果表。(B) “结直肠癌”集合的详细信息表。(C) “疾病”类别富集分析的验证结果。(D) 富集分析结果。](https://oup.silverchair-cdn.com/oup/backfile/Content_public/Journal/nar/52/D1/10.1093_nar_gkad1008/1/m_gkad1008fig2.jpeg?Expires=1721185615&Signature=CBBrkKHh0WI3TnoIhettMMHyliymiqJjIl9544kGIP1nJVR2mOajo8ZucN7FI5VvSANAzr9CbBrYQftd4AQQ1Dok53OnlU9LE-3lxZzHZ0Dcun6O0Kku0HqIAFWAw-LWa6CQdtpRqE5TarJANrV1qT4yeb30Bb~TLzrTcMrJUba6a0OQNT5uxUAY9~bIfAEDIhiriRlv-v7Ha-5iar-87Dpna8xXVeG23niABXxhPdMWV8kBMqRZgEQl2fx-aS5vsj2vEjP9lDUzDHRhy~D3BSa7gyW1-Vv1VTxRCs92sFoFsPb-JKOP1U4zzGN~ML4dRnsYiTHI7igJiFF8fS3CBw__&Key-Pair-Id=APKAIE5G5CRDK6RD3PGA)
图2。
结直肠癌lncRNAs富集分析结果。(一个)“疾病”类别的结直肠癌输入数据和浓缩分析结果表。(B类)“结直肠癌”集合的详细信息表。(C类)“疾病”类别富集分析的验证结果。(D类)富集分析结果。
LncRNAs被认为是疾病的关键调节因子,并已被证明通过许多生物学功能参与病理过程。我们根据lncRNAs介导的生物学功能对人类疾病是否有积极(+)或消极(-)影响对所有关系进行分类。在“实验验证功能”类别中,葡萄糖代谢过程与WNT/β-catenin信号通路呈正相关,而细胞转移则呈负相关。此外,MIR22HG在细胞转移集中富集。文献证实MIR22HG可以促进肿瘤内CD8 T细胞的存在。注射MIR22HG和PDL1抑制剂可以有效抑制肿瘤细胞,表明MIR22HG和PDL2抑制剂联合治疗结直肠癌的潜力(27).
lncRNA跨组织的空间表达模式对于揭示或研究lncRNA在不同组织中的功能至关重要。此外,lncRNA空间表达模式为疾病机制和组织特异性治疗靶点提供了重要的生物学线索。“组织空间表达”类别表明结肠具有最高的富集分数。研究表明,TcoF在结直肠癌的发生和发展中起着关键的调节作用。例如,转录辅因子TDG通过DNMT3A-TIMP2轴抑制人类结肠癌细胞的迁移和侵袭,可能成为结直肠癌发展和治疗的一种前瞻性治疗策略(47). 此外,敲除转录辅因子CCNK可以减少体内CRC细胞的增殖和肿瘤的生长体内研究转录辅助因子在结直肠癌中的作用和机制,有助于深入了解结直肠癌的发病机制,为结直肠癌的诊断和治疗提供新的靶点和策略(48). 文献中证实了lncRNA HOTAIR和TcoF DEPDC1之间的调节关系。CCAT1和HOTAIR联合应用对早期结直肠癌具有优越的诊断效果(27)免疫系统基因调控模式的紊乱被认为是各种癌症发展的主要原因。lncRNA相关潜在调节因子的鉴定和表征对于癌症免疫治疗至关重要。在“癌症免疫学”类别中,我们成功地在七个显示集中富集了TCGA-COOD和TCGA-READ,表明相关lncRNA在结直肠癌免疫细胞中高度富集。文献也证实了结直肠癌(28)可以采取免疫治疗策略。文献中证实富含TCGA-COOD的lncRNA HAND2-AS1是COAD EMT-相关lncRNA的早期诊断生物标志物(29). 此外,HAND2-AS1存在于TCGA-READ核心富集lncRNA列表中,但其用途尚未得到广泛研究,这表明HAND2-ASP1可能作为直肠癌的诊断标记物。在与TCGA-COOD和TCGA-READ集相关的lncRNA中,MIR22HG最近被报道为一种肿瘤抑制剂,促进了结直肠癌的免疫治疗(27). 一些研究表明,富含TCGA-READ的lncRNA MIR100HG可以维持对西妥昔单抗的耐药性在体外和体内促进结直肠癌细胞的侵袭和转移(30). 从上述分析可以看出,一些分析结果与我们的假设一致(图二维).
结论和未来扩展
随着对lncRNAs研究的迅速积累,获得了许多新的见解。我们开发了LncSEA 2.0,这是一个更新的平台,它通过广泛收集和处理公共数据资源,并结合使用生物信息学工具预测的其他lncRNA参考集,扩展了其应用范围。LncSEA 2.0更新和扩展了现有的lncRNA集合,并新增了15类lncRNA集。具体而言,LncSEA 2.0收集了大量与表观遗传调控相关的lncRNA集,例如多个转录调节因子集(TF、TcoF和CR),它们可以协同结合DNA顺式-调节下游lncRNAs的调节元件。更新后的平台中还嵌入了大量与肿瘤免疫相关的lncRNA集。LncRNAs在肿瘤免疫调节中发挥关键作用,改变T细胞亚群的平衡及其对凋亡的敏感性,形成新的肿瘤免疫逃逸机制。LncSEA 2.0还新记录了许多在转录后水平发挥作用的lncRNA,如ceRNA和m6A修饰相关lncRNA集。此外,LncSEA 2.0引入了各种富集分析方法,有助于进一步探索lncRNA的功能。
未来,我们将继续与lncRNA相关研究的持续进展保持一致,以满足在lncRNA见解积累的推动下对精确数据日益增长的需求。此外,我们将持续更新LncSEA数据库,以提供全面和最新的数据集资源。鉴于当前数据集的复杂性,整合来自多个来源的信息并为来自不同来源的lncRNA集分配更大的权重是一个可行的解决方案。然而,考虑到数据的广泛规模,我们可能会在后续版本中制定相关的评分和整合策略。此外,虽然当前版本包含全面的人类lncRNA参考集,但其他模式生物在生物学和医学研究中也同样重要。因此,我们计划在下一版本中包括更多的模式生物。
总之,LncSEA 2.0提供了更全面的lncRNA参考资源,增强了数据处理工作流和网站功能,并引入了额外的富集分析方法。我们相信,LncSEA将继续促进lncRNA功能的探索。
数据可用性
研究社区无需注册或登录即可在LncSEA 2.0中自由访问信息http://bio.liclab.net/LncSEA/index.php.
补充数据
补充数据可在NAR Online上获得。
基金
国家自然科学基金项目[62272212,62171166,62272211,62302206];华南大学第一附属医院高级人才研究基金项目[20210002-1005 USCAT-2021-01];中国博士后科学基金项目[2019M661311];湖南省自然科学基金项目[2023JJ40594,2023JJ30536,2023JJ30535];湖南省卫生健康委员会科研基金项目【20201920】;华南大学4310临床研究项目[20224310NHYCG05]。开放存取费资助:国家自然科学基金[62272212,62171166,62272211,62302206];华南大学第一附属医院高级人才研究基金【20210002-1005 USCAT-2021-01】;中国博士后科学基金项目[2019M661311];湖南省自然科学基金项目[2023JJ40594,2023JJ305362023JJ 30535];黑龙江省自然科学基金项目(LH2021F044);湖南省卫生委员会科研基金项目[20201920];华南大学4310临床研究项目[20224310NHYCG05]。
利益冲突声明。未声明。
工具书类
1王
K.C.公司。
,张
香港。
长非编码RNA的分子机制
.摩尔细胞
.2011
;43
:904
——914
. 2罗
H。
,朱
G.公司。
,徐
J。
,赖
问:。
,严
B。
,郭
年。
,冯
T.K.公司。
,泽西格
商业银行。
,崔
年。
,查
J。
等。
HOTTIP lncRNA促进造血干细胞自我更新导致小鼠AML样疾病
.癌细胞
.2019
;36
:645
——659
. 三。斯塔泰洛
L。
,郭
C.-J.公司。
,陈
左旋-左旋。
,华尔特
M。
长非编码RNA的基因调控及其生物学功能
.自然修订版分子细胞生物学。
2021
;22
:96
——118
. 4黄
D。
,陈
J。
,杨
L。
,欧阳
问:。
,锂
J。
,老挝语
L。
,赵
J。
,线路接口单元
J。
,卢
年。
,Xing(兴)
年。
等。
NKILA lncRNA通过使T细胞对激活诱导的细胞死亡敏感而促进肿瘤免疫逃避
.自然免疫学。
2018
;19
:1112
——1125
. 5徐
J。
,曹
十、。
长非编码RNA在炎症和免疫疾病代谢控制中的作用
.细胞分子免疫
.2019
;16
:1
——5
. 6杨
美国。
,林
K.-H.公司。
,基姆
S.-H.公司。
,乔(Joo)
J.-Y.公司。
脑疾病中长非编码RNA的分子景观
.分子精神病学
.2021
;26
:1060
——1074
. 7萨尔达纳·梅耶
R。
,罗德里格斯-赫内兹
J。
,埃斯科瓦尔
T。
,Nishana公司
M。
,雅科梅·洛佩斯
英国。
,诺拉
E.P.公司。
,文莱
英国政府。
,齐里戈斯
答:。
,Furlan-Magaril公司
M。
,斯科克
J。
等。
RNA相互作用对CTCF介导的基因组组织至关重要
.摩尔细胞
.2019
;76
:412
——422
. 8汉族
第页。
,锂
西。
,林
中心-中心。
,杨
J。
,尚
C、。
,纽伦堡
S.T.公司。
,金
英国。
,徐
西。
,林
C.-Y.公司。
,林
C.-J.公司。
等。
长的非编码RNA保护心脏免受病理性肥大
.自然
.2014
;514
:102
——106
. 9王
十、。
,线路接口单元
C、。
,张
美国。
,严
H。
,张
L。
,江
答:。
,线路接口单元
年。
,冯
年。
,锂
D。
,郭
年。
等。
MALAT1的N6-甲基腺苷修饰通过重塑核斑点促进转移
.开发单元
.2021
;56
:702
——715
. 10吴
R。
,锂
答:。
,太阳
B。
,太阳
J.-G公司。
,张
J。
,张
T。
,陈
年。
,肖
年。
,高
年。
,张
问:。
等。
一种新型m6A读取器Prrc2a控制少突胶质细胞的规格和髓鞘形成
.细胞研究。
2019
;29
:23
——41
. 11周
B。
,季
B。
,线路接口单元
英国。
,胡
G.公司。
,王
F、。
,陈
问:。
,于
R。
,黄
第页。
,任
J。
,郭
C、。
等。
EVLncRNAs 2.0:一个经低通量实验验证的人工筛选功能性长非编码RNA的更新数据库
.核酸研究。
2021
;49
:第86页
——D91(数字91)
. 12宁
L。
,崔
T。
,郑
B。
,王
N。
,罗
J。
,杨
B。
,杜
M。
,程
J。
,窦
年。
,王
D。
MNDR v3.0:增加覆盖范围和注释的哺乳动物ncRNA-disease库
.核酸研究。
2021
;49
:D160型
——第164页
. 13线路接口单元
L。
,锂
Z.公司。
,线路接口单元
C、。
,邹
D。
,锂
问:。
,冯
C、。
,京
西。
,罗
美国。
,张
Z.公司。
,妈妈
L。
LncRNAWiki 2.0:人类长非编码RNA的知识库,具有增强的管理模型和数据库系统
.核酸研究。
2022
;50
:D190型
——D195型
. 14包
Z.公司。
,杨
Z.公司。
,黄
Z。
,周
年。
,崔
问:。
,东
D。
LncRNADisease 2.0:长时间非编码RNA相关疾病的更新数据库
.核酸研究。
2019
;47
:D1034号
——第1037天
. 15高
年。
,尚
美国。
,郭
美国。
,锂
十、。
,周
H。
,线路接口单元
H。
,太阳
年。
,王
J。
,王
第页。
,支
H。
等。
Lnc2Cancer 3.0:基于RNA-seq和scRNA-seq数据的实验支持的lncRNA/circRNA癌症关联和网络工具的更新资源
.核酸研究。
2021
;49
:D1251号
——D1258号
. 16康
J。
,唐
问:。
,他
J。
,锂
L。
,杨
N。
,于
美国。
,王
M。
,张
年。
,林
J。
,崔
T。
等。
RNAInter v4.0:具有重新定义的置信度评分系统和改进的可访问性的RNA相互作用库
.核酸研究。
2022
;50
:D326号
——D332号
. 17滕
十、。
,陈
十、。
,薛
H。
,唐
年。
,张
第页。
,康
问:。
,郝
年。
,陈
R。
,赵
年。
,他
美国。
NPInter v4.0:ncRNA相互作用的集成数据库
.核酸研究。
2020
;48
:D160型
——D165型
. 18锂
J.-H.公司。
,线路接口单元
美国。
,周
H。
,曲
左侧-右侧。
,杨
J.-H.公司。
starBase v2.0:从大规模CLIP-Seq数据中解码miRNA-ceRNA、miRNA-ncRNA和蛋白质-RNA相互作用网络
.核酸研究。
2014
;42
:D92型
——D97号
. 19江
T。
,周
西。
,张
Z.公司。
,邹
H。
,白
J。
,太阳
问:。
,平移
T。
,徐
J。
,锂
年。
,锂
十、。
ImmReg:跨癌症类型免疫相关通路的调控基因图谱
.核酸研究。
2021
;49
:12106
——12118
. 20布鲁尔
英国。
,福鲁沙尼语
英国。
,莱尔德
M.R.公司。
,陈
C、。
,斯里巴尼亚
答:。
,Lo(低)
R。
,Winsor公司
G.L.公司。
,汉考克
R.E.W.公司。
,布林克曼
F.S.L.公司。
,林恩
D.J.公司。
InnateDB:先天免疫及其以外的系统生物学——最新更新和持续管理
.核酸研究。
2013
;41
:D1228号
——D1233号
. 21巴塔查里亚
美国。
,邓恩
第页。
,托马斯
C.G.公司。
,史密斯
B。
,谢弗
H。
,陈
J。
,胡
Z.公司。
,扎洛克斯基
K.A.公司。
,尚卡尔
钢筋混凝土。
,Shen-Orr公司
S.S.公司。
等。
ImmPort,致力于将开放存取免疫分析数据重新用于转化和临床研究
.科学。数据
.2018
;5
:180015
. 22Subramanian语
答:。
,塔马约
第页。
,穆萨
V.K.公司。
,穆克吉
美国。
,埃伯特
B.L.公司。
,吉列
文学硕士。
,保洛维奇
答:。
,波梅罗伊
S.L.公司。
,格鲁布
T.R.公司。
,着陆器
E.S.公司。
等。
基因集富集分析:基于知识的全基因组表达谱解释方法
.程序。国家。阿卡德。科学。美国。
2005
;102
:15545
——15550
. 23哈恩泽尔曼
美国。
,卡斯特罗
R。
,吉尼
J。
GSVA:微阵列和RNA-Seq数据的基因集变异分析
.BMC生物信息。
2013
;14
:7
. 24莫尔德
F、。
,贾布隆斯基
K.P.公司。
,Letcher公司
B。
,霍尔
医学学士。
,Tomkins-Tinch公司
C.H.公司。
,Sochat公司
五、。
,福斯特
J。
,李
美国。
,特瓦尔齐奥
S.O.公司。
,卡尼茨
答:。
等。
使用Snakemake进行可持续数据分析[版本2;同行评审:2已批准]
.F1000研究
.2021
;10
:33
. 25锂
十、。
,施
L。
,王
年。
,钟
J。
,赵
十、。
,滕
H。
,施
十、。
,杨
H。
,阮
美国。
,锂
M。
等。
OncoBase:解码人类癌症调节性体细胞突变的平台
.核酸研究。
2019
;47
:第104天
——D1055号
. 26赵
H。
,阴
十、。
,徐
H。
,线路接口单元
英国。
,线路接口单元
西。
,王
L。
,张
C、。
,波
L。
,局域网
十、。
,林
美国。
等。
LncTarD 2.0:人类疾病中实验支持的功能性lncRNA-靶向调控的更新综合数据库
.核酸研究。
2023
;51
:D199型
——第207天
. 27冯
C、。
,歌曲
C、。
,线路接口单元
年。
,钱
F、。
,高
年。
,宁
Z.公司。
,王
问:。
,江
年。
,锂
年。
,锂
M。
等。
KnockTF:一个具有转录因子敲除/敲除功能的综合人类基因表达谱数据库
.核酸研究。
2020
;48
:D93(D93)
——D100型
. 28癌症基因组图谱研究网络
温斯坦
J.N.公司。
,科里森
E.A.公司。
,米尔斯
通用电气公司。
,肖
K.R.M.公司。
,Ozenberger公司
文学学士。
,埃尔罗特
英国。
,什穆列维奇
一、。
,砂光机
C、。
,斯图亚特
J.M.公司。
癌症基因组图谱泛癌分析项目
.自然基因。
2013
;45
:1113
——1120
. 29锂
T。
,傅
J。
,曾
Z.公司。
,科恩
D。
,锂
J。
,陈
问:。
,锂
B。
,线路接口单元
X、S、。
TIMER2.0用于分析肿瘤浸润免疫细胞
.核酸研究。
2020
;48
:W509型
——W514号机组
. 30阿什伯恩
M。
,球
首席执行官。
,布莱克
J.A.公司。
,博茨坦
D。
,巴特勒
H。
,樱桃
J.M.公司。
,戴维斯
A.P.公司。
,多林斯基
英国。
,德怀特
S.S.公司。
,Eppig公司
J·T。
等。
基因本体论:生物学统一的工具
.自然基因。
2000
;25
:25
——29
. 31王
美国。
,周
美国。
,线路接口单元
H。
,孟
问:。
,妈妈
十、。
,线路接口单元
H。
,王
L。
,江
西。
ncRI:一个人工策划的数据库,用于实验验证炎症中的非编码RNA
.Bmc基因组学(电子资源)
.2020
;21
:380
. 32张
J。
,巴拉恩
J。
,克罗斯
答:。
,古伯曼
J.M.公司。
,海德尔
美国。
,徐
J。
,梁
年。
,里夫金
E.公司。
,王
J。
,惠蒂
B。
等。
国际癌症基因组联盟数据门户–癌症基因组数据的一站式服务
.数据库(牛津)
.2011
;2011
:巴026
. 33吕
D。
,徐
英国。
,金
十、。
,锂
J。
,施
年。
,张
M。
,金
十、。
,锂
年。
,徐
J。
,锂
十、。
LncSpA:lncRNA在正常组织和癌组织中表达的空间图谱
.癌症研究。
2020
;80
:2067
——2071
. 34张
年。
,歌曲
C、。
,张
年。
,王
年。
,冯
C、。
,陈
J。
,世界环境学会
L。
,平移
问:。
,尚
D。
,朱
年。
等。
TcoFBase:解码人和小鼠调节性转录辅因子的综合数据库
.核酸研究。
2022
;50
:D391号
——D401型
. 35张
美国。
,他
十、。
,张
R。
,邓
西。
LncR2metata:在各种癌症转移事件中,人工管理实验支持的lncRNAs数据库
.生物信息简介
.2021
;22
:英国广播公司178
. 36王
第页。
,郭
问:。
,郝
年。
,线路接口单元
问:。
,高
年。
,支
H。
,锂
十、。
,尚
美国。
,郭
美国。
,张
年。
等。
LnCeCell:以单细胞分辨率预测lncRNA相关ceRNA网络的综合数据库
.核酸研究。
2021
;49
:第125天
——D133号
. 37王
第页。
,郭
问:。
,气
年。
,郝
年。
,高
年。
,支
H。
,张
年。
,太阳
年。
,张
年。
,Xin(新)
M。
等。
LncACTdb 3.0:实验支持的ceRNA相互作用和有助于精确医学的个性化网络的更新数据库
.核酸研究。
2022
;50
:D183号
——D189号
. 38邓
美国。
,张
H。
,朱
英国。
,锂
十、。
,Ye(是)
年。
,锂
R。
,线路接口单元
十、。
,林
D。
,左
Z.公司。
,郑
J。
M6A2Target:针对m6A编写器、橡皮擦和阅读器的综合数据库
.生物信息简介
.2021
;22
:英国广播公司055
. 39邓
年。
,罗
H。
,杨
Z.公司。
,线路接口单元
L。
LncAS2Cancer:人类癌症lncRNA选择性剪接的综合数据库
.生物信息简介
.2021
;22
:英国广播公司179
. 40沈
美国。
,公园
J.W.公司。
,卢
Z。
,林
L。
,亨利
医学博士。
,吴
Y.编号。
,周
问:。
,Xing(兴)
年。
rMATS:从重复RNA-Seq数据中稳健灵活地检测差异选择性剪接
.程序。国家。阿卡德。科学。美国。
2014
;111
:e5953
——E5601型
. 41Vaquero-Garcia公司
J。
,巴雷拉
答:。
,加扎拉
M.R.公司。
,冈萨雷斯-瓦利纳斯
J。
,拉亨斯
abbr.国家处方集
,霍格内什
J.B.公司。
,林奇
科威特。
,巴拉什
年。
从局部剪接变异的角度看转录组的复杂性和调控
.电子生活
.2016
;5
:11752元
. 42秦
Z.公司。
,斯托伊洛夫
第页。
,张
十、。
,Xing(兴)
年。
SEASTAR:RNA中替代转录起始位点的系统评估
.核酸研究。
2018
;46
:e45(电子45)
. 43夏
Z.公司。
,Donehower公司
洛杉矶。
,库珀
T.A.公司。
,尼尔森
J.R.公司。
,惠勒
D.A.公司。
,瓦格纳
E.J.公司。
,锂
西。
来自RNA-seq的选择性聚腺苷酸化的动态分析揭示了7种肿瘤类型的3′-UTR图谱
.国家公社。
2014
;5
:5274
. 44特林卡多
法学博士。
,Entizne公司
J.C.公司。
,海塞纳吉
G.公司。
,辛格
B。
,斯卡利克
M。
,埃利奥特
D.J.公司。
,埃拉斯
E.公司。
SUPPA2:跨多种条件的快速、准确和不确定性差异拼接分析
.基因组生物学。
2018
;19
:40
. 45黄
年。
,圣圭内蒂
G.公司。
BRIE:单细胞转录组全剪接定量
.基因组生物学。
2017
;18
:123
. 46张
年。
,张
年。
,歌曲
C、。
,赵
十、。
,艾岛
B。
,王
年。
,周
L。
,朱
J。
,冯
C、。
,徐
L。
等。
CRdb:解读人类染色质调节因子的综合资源
.核酸研究。
2023
;51
:D88型
——D100型
. 47苗族
J。
,赵
C、。
,唐
英国。
,熊
十、。
,吴
F、。
,薛
西。
,段
B。
,张
H。
,京
十、。
,锂
西。
等。
TDG通过DNMT3A/TIMP2轴抑制人结肠癌细胞的迁移和侵袭
.国际生物学杂志。科学。
2022
;18
:2527
——2539
. 48迪特尔
S.M.公司。
,西格尔
C、。
,科多
P.L.公司。
,韦尔塔
M。
,奥斯特曼-帕鲁查
A.L.公司。
,舒尔茨
E.公司。
,佐瓦达
M.K.医学博士。
,马丁
美国。
,拉贝尔
英国。
,诺鲁齐
答:。
等。
CCNK/CDK12的降解是结直肠癌的药物易感性
.单元格代表。
2021
;36
:109394
.
作者注释
©作者2023。由牛津大学出版社代表核酸研究出版。