跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
.2010年12月;20(12):1730-9.
doi:10.1101/gr.108217.110。 Epub 2010年11月2日。

使用SAGE-Seq对人类乳腺组织样本进行基因表达谱分析

附属公司
比较研究

使用SAGE-Seq对人类乳腺组织样本进行基因表达谱分析

振华Jeremy Wu等。 基因组研究. 2010年12月.

摘要

我们提出了超高通量测序的强大应用,SAGE-Seq,用于准确定量正常和肿瘤乳腺上皮细胞转录组。我们开发了数据分析管道,用于绘制线粒体和RefSeq基因的正反义链,库之间的标准化,以及识别差异表达的基因。我们发现癌症转录组的多样性明显高于正常细胞。我们的分析表明,转录物发现停滞在1000万读/样本,并建议所需的最小测序深度约为500万读。SAGE-Seq与传统SAGE在正常和癌变乳腺组织上的比较显示,SAGE-Se对检测不太丰富的基因(包括编码已知乳腺癌相关转录因子和G蛋白偶联受体(GPCR)的基因)具有更高的敏感性。SAGE-Seq能够识别传统SAGE无法识别的乳腺癌异常激活的基因和途径。SAGE-Seq是鉴定人类疾病生物标志物和治疗靶点的有力方法。

PubMed免责声明

数字

图1。
图1。
SAGE-Seq标签对齐和排序错误最小化。(一个)最佳标记是指紧邻poly(A)尾部的最3′端NlaIII位点(CATG)的标记。(B类)根据补充图S3中的标签对齐管道,样本N1的标签对齐统计。其他数据集的详细映射如补充电子表格1所示。(C类)标签映射期间显示的假定排序错误。所有列出的标签都是唯一映射到同一RefSeq基因“NM_001010”的最佳标签。(并非列出了在同一位置唯一映射到此基因的每个标签。)X(X)-axis是按标签计数的降序列出的标签序列。最有可能是由于测序错误导致的序列中的一个碱基差异用红色标记。这个特定例子的测序错误最小化步骤是通过以下方式完成的:将所有这些标签的计数相加,并将其分配给标签“CATGGCCGTGTCCGCCTGCTA”,并删除所有其他标签。
图2。
图2。
独特标签计数频率图和非参数经验贝叶斯方法。(一个)库N1(黑色)和N5(红色)中唯一标记计数的频率。X(X)-axis是观察到的标签计数-axis是显示具有特定计数的唯一标记数的频率。(B类)描述库N1中唯一标签分布的饼图:62.6%的唯一标签的标签计数1、12.1%、计数2、5.5%、计数3和19.8%的计数大于3。外部图显示了唯一标记计数的累计分数。尽管62.6%的唯一标签计数为1,但它们仅占总标签计数的3%。(C类)标签比例散点图。X(X)-axis是通过随机抽样10%的文库N1获得的伪文库1中的标签的比例。Y(Y)-轴是通过随机抽样1%库N1获得的伪库2的平均比例。数据点通过以下方式获得。例如,在伪库1中查找比例为1×10的所有标签−6,然后计算这些标记在伪库2中的平均比例,例如给出1×10−5。这给出了(1×10)处的数据点−6, 1 × 10−5). 虚线为=x黑色符号表示使用最大似然估计值的比例,其中低表达和中等表达的标签(<100/百万)被高估,高表达的标签被低估(>1000/百万)。红色符号表示使用非参数经验贝叶斯方法计算的比例,该方法在低丰度和高丰度标签中具有不同排序深度的两个库之间具有改进的、更具可比性的校正比例。
图3。
图3。
正常和癌症转录组的多样性。(一个)辛普森多样性指数用于衡量文库内基因表达多样性。与正常组相比,癌症组的库内多样性较高。(B类)方框图描绘了正常和癌症样本的辛普森多样性指数。P(P)=0.07284(威尔科森秩和检验)。(C类)定义为“1–Morisita-Horn相似性指数”的距离用于测量跨库的基因表达多样性。正常组的图书馆彼此更相似,而癌症图书馆则更为多样化。(D类)使用中定义的“距离”进行分层聚类C类分离正常和癌症库。
图4。
图4。
SAGE-Seq标记映射和测序深度饱和度曲线。(A–C)三个选定基因家族表达谱的差异覆盖率:转录因子(一个),GPCR(B类)和ABC运输车(C类).Y(Y)-axis列出了基因和x-axis是平均基因表达指数(标准化标签计数的对数)。红色和蓝色分别表示传统SAGE和SAGE-Seq。SAGE-Seq在这些基因家族中检测到的基因比传统SAGE更多。(D类)唯一的最佳标记基因数(-轴)与测序深度相关(x-轴)。最佳标记基因的数量是由最佳标记映射的唯一基因的数量,如果多个标记映射到同一基因的最佳标记,则计算为一个。黑色和红色分别表示正常组和癌症组。符号“○”和“▴”分别表示传统SAGE和SAGE-Seq。实体曲线(饱和度曲线)是通过对正常(或癌症)组中所有库的组合进行采样而得到的模拟结果,这些库描述了随着测序深度增加的趋势。传统SAGE识别的最佳标签基因比SAGE-Seq要少得多。SAGE-Seq显示,癌症样本(红色三角形)比正常样本(黑色三角形)具有更多独特的最佳标记基因。传统SAGE无法检测到这种差异(红圈与黑圈)。
图5。
图5。
差异表达基因及其变异。(一个)去除噪声和归一化后,七个标准库的均值-方差图。红色虚线是对数图中最佳的线性拟合。斜率给出了指数α正面≈1.9蓝色虚线是通过采样引入的均值-方差线。(B类)鉴别差异表达基因的流水线:(1)测序误差最小化:标签对齐后,在相同位置映射到相同基因的标签被组合在一起;(2) NEB用于规范不同序列深度的不同库;(3) 过滤以删除少于两个库中计数≥3/百万的标记,然后是日志2转型;(4) SAM用于检测差异表达基因。(C类)检测到差异表达基因(顶部)和激活的途径(底部)在SAGE-Seq和传统SAGE中。SAGE-Seq以1%的FDR识别约4000个差异基因,而传统SAGE以更宽松的截止值(10%的FDR)识别<200个差异基因。P(P)=0.001,SAGE-Seq确定了99条在乳腺癌中显著激活的通路,而传统SAGE仅显示32条。仅由SAGE-Seq识别而被传统SAGE遗漏的80条通路均为乳腺癌相关通路。(D类)重叠比率(定义为重叠基因数除以顶部传统SAGE中的基因数x差异表达基因的百分比,其中x在0和1之间更改。黑色符号表示实际数据(SAGE-Seq与传统SAGE)。这表明SAGE-Seq和传统SAGE之间的顶级差异表达基因列表几乎没有重叠。红色符号表示模拟(SAGE-Seq与向下采样的SAGE-Seq)。抽样SAGE-Seq意味着从每个SAGE-Seq库中对50 k个标签进行二项抽样;50000是传统SAGE的典型测序深度。模拟证实了与实际数据相同的结论:与传统的SAGE相比,SAGE-Seq给出了不同的差异表达基因列表。更深入的测序表明,传统SAGE与SAGE-Seq相比识别出不同组的差异表达基因,从而证实了我们的结论,即传统SAGE缺乏足够的测序深度。

类似文章

  • 用于癌症基因表达谱分析的下一代标签测序。
    Morrissy AS、Morin RD、Delaney A、Zeng T、McDonald H、Jones S、Zhao Y、Hirst M、Marra MA。 Morrissy AS等人。 基因组研究,2009年10月;19(10):1825-35。doi:10.1101/gr.094482.109。Epub 2009年6月18日。 2009年基因组研究。 PMID:19541910 免费PMC文章。
  • SAGE库中测序错误的统计建模。
    Beissbarth T、Hyde L、Smyth GK、Job C、Boon WM、Tan SS、Scott HS、Speed TP。 Beissbarth T等人。 生物信息学。2004年8月4日;20补充1:i31-9。doi:10.1093/bioinformatics/bth924。 生物信息学。2004 PMID:15262778
  • 【基因表达序列分析的转录组】。
    Marti J、Piquemal D、Manchon L、Commes T。 Marti J等人。 《社会生物学杂志》。2002;196(4):303-7. 《社会生物学杂志》。2002 PMID:12645300 审查。 法国人。
  • HIN-1是一种假定的细胞因子,在正常而非癌性乳腺上皮细胞中高度表达。
    Krop IE、Sgroi D、Porter DA、Lunetta KL、LeVangie R、Seth P、Kaelin CM、Rhei E、Bosenberg M、Schnitt S、Marks JR、Pagon Z、Belina D、Razumovic J、Polyak K。 Krop IE等人。 美国国家科学院院刊2001年8月14日;98(17):9796-801. doi:10.1073/pnas.171138398。Epub 2001年7月31日。 美国国家科学院院刊,2001年。 PMID:11481438 免费PMC文章。
  • 技术评价:SAGE、Genzyme分子肿瘤学。
    巴特利特·J。 巴特利特·J。 当前操作摩尔热。2001年2月;3(1):85-96. 当前操作摩尔热。2001 PMID:11249736 审查。

引用人

  • KDM5组蛋白脱甲基酶活性将细胞转录组异质性与治疗耐药性联系起来。
    Hinohara K、Wu HJ、Vigneau S、McDonald TO、Igarashi KJ、Yamamoto KN、Madsen T、Fassl A、Egri SB、Papanastasiou M、Ding L、Peluffo G、Cohen O、Kales SC、Lal-Nag M、Rai G、Maloney DJ、Jadhav A、Simeonov A、Wagle N、Brown M、Meissner A、Sicinski P、Jaffe JD、Jeselsohn R、Gimelbrant AA、Michor F、Polyak K。 Hinohara K等人。 癌细胞。2018年12月10日;34(6):939-953.e9。doi:10.1016/j.cell.2018.10.1014。Epub 2018年11月21日。 癌细胞。2018 PMID:30472020 免费PMC文章。
  • CRISPRcloud:一种用于CRISPR池屏反褶积的基于云的安全管道。
    Jeong HH、Kim SY、Rousseaux MWC、Zoghbi HY、Liu Z。 Jeong HH等人。 生物信息学。2017年9月15日;33(18):2963-2965. doi:10.1093/bioinformatics/btx335。 生物信息学。2017 PMID:28541456 免费PMC文章。
  • 乳腺原位导管癌:与进展相关的形态学和分子特征。
    Carraro DM、Elias EV、Andrade副总裁。 Carraro DM等人。 Biosci报告,2014年2月1日;34(1):e00090。doi:10.1042/BSR20130077。2014年2月1日印刷。 生物科技报告2014。 PMID:27919043 免费PMC文章。 审查。
  • 成纤维细胞的空间邻近性影响乳腺癌细胞的分子特征和治疗敏感性,从而影响临床结果。
    Marusyk A、Tabassum DP、Janiszewska M、Place AE、Trinh A、Rozhok AI、Pyne S、Guerriero JL、Shu S、Ekram M、Ishkin A、Cahill DP、Nikolsky Y、Chan TA、Rimawi MF、Hilsenbeck S、Schiff R、Osborne KC、Letai A、Polyak K。 Marusyk A等人。 癌症研究2016年11月15日;76(22):6495-6506. doi:10.1158/0008-5472.CAN-16-1457。Epub 2016年9月26日。 2016年癌症研究。 PMID:27671678 免费PMC文章。
  • 肝细胞癌细胞基因表达的多样性。
    Zhang F、Cui L、Kuo MD。 张飞等。 基因组蛋白质组学生物信息学。2015年12月;13(6):377-82. doi:10.1016/j.gpb.2015.07.003。Epub 2016年1月11日。 基因组蛋白质组学生物信息学。2015 PMID:26779818 免费PMC文章。

工具书类

    1. Adams MD、Kelley JM、Gocayne JD、Dubnick M、Polymeropoulos MH、Xiao H、Merril CR、Wu A、Olde B、Moreno RF等,1991年。互补DNA测序:表达序列标签和人类基因组计划。科学252:1651–1656-公共医学
    1. Baggerly KA、Deng L、Morris JS、Aldaz CM 2003。SAGE中的差异表达:解释库变异之间的正常现象。生物信息学19:1477–1483-公共医学
    1. Baggerly KA、Deng L、Morris JS、Aldaz CM 2004。SAGE的过度分散逻辑回归:建模多组和协变量。BMC生物信息学5:144 doi:10.1186/1471-2105-5-144-项目管理咨询公司-公共医学
    1. Bloushtain-Qimron N、Yao J、Snyder EL、Shipitsin M、Campbell LL、Mani SA、Hu M、Chen H、Ustyansky V、Antosiewicz JE等,2008年。人类乳腺中细胞类型特异性DNA甲基化模式。《国家科学院院刊》105:14076–14081-项目管理咨询公司-公共医学
    1. Cai L、Huang H、Blackshaw S、Liu JS、Cepko C、Wong WH 2004。使用泊松方法对SAGE数据进行聚类分析。基因组生物学5:R51 doi:10.1186/gb-2004-5-7-51-项目管理咨询公司-公共医学

出版物类型

关联数据