×

通过扫描统计从Hi-C数据进行移位检测。 (英语) Zbl 1522.62109号

摘要:最近的Hi-C技术使染色体构象研究更加全面,包括检测结构变异,特别是易位。本文将染色体间易位检测定义为空间点过程中的扫描聚类问题。然后我们开发了TranScan,这是一种新的易位检测方法,通过扫描统计来控制错误发现。仿真表明,TranScan比现有的复杂扫描聚类方法更强大,尤其是在强信号情况下。根据实际数据生成的真实断点模拟对当前易位检测方法进行的TranScan评估表明,在接收器操作特性曲线下具有更好的辨别能力。功率分析还强调了当测序深度和杂合率发生变化时,TranScan的持续表现。相比之下,使用核型正常细胞系进行评估时,I型错误率最低。模拟和实际数据分析都表明,TranScan在利用Hi-C数据检测染色体间易位方面具有巨大的潜力。
{©2022国际生物识别学会。}

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析

软件:

变点
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Bonferroni,C.(1936)《概率分类与概率计算》。Pubblicazioni del R Istituto Superiore di Science Economiche e Commericiali di Firenze,第8页,第3-62页·Zbl 0016.41103号
[2] Burton,J.N.、Adey,A.、Patwardhan,R.P.、Qiu,R.、Kitzman,J.O.和Shendure,J.(2013)基于染色质相互作用的新生基因组组装的染色体规模支架。《自然生物技术》,31(12),1119-1125。
[3] Chakraborty,A.和Ay,F.(2017)从hi‐c数据中识别癌细胞中的拷贝数变化和移位。生物信息学,34(2),338-345。
[4] Chan,H.P.和Zhang,N.R.(2007)用加权观测值扫描统计数据。《美国统计协会杂志》,102(478),595-602·Zbl 1172.62322号
[5] Dixon,J.R.,Selvaraj,S.,Yue,F.,Kim,A.,Li,Y.,Shen,Y.等人(2012)通过分析染色质相互作用确定哺乳动物基因组的拓扑结构域。《自然》,485(7398),376-380。
[6] Dixon,J.R.,Xu,J.,Dileep,V.,Zhan,Y.,Song,F.,Le,V.T.等人(2018)癌症基因组结构变异的综合检测和分析。《自然遗传学》,50(10),1388-1398。
[7] Epanechnikov,V.A.(1969)多元概率密度的非参数估计。概率论及其应用,14(1),153-158。
[8] Glaz,J.(1992)扫描统计的尾部概率和矩的近似值。计算统计与数据分析,14(2),213-227·Zbl 0875.62067号
[9] Glaz,J.&Naus,J.I.(1999)《扫描统计与应用》。收录:Glaz,J.(编辑)和Naus,J.I.(编辑。)《统计科学百科全书》。纽约:威利·Zbl 0919.00015号
[10] Glaz,J.、Naus,J.I.和Wallenstein,S.(2001)二维扫描统计。收录:Glaz,J.(编辑)、Naus,J.I.和Wallenstein,S.(编辑。)扫描统计。纽约:施普林格出版社,第273-300页·兹比尔0983.62075
[11] Glaz,J.、Pozdnyakov,V.和Wallenstein,S.(2009)《扫描统计:方法和应用》(工业和技术统计),第2版。波士顿:Birkhäuser,第422页·Zbl 1165.6202号
[12] Harewood,L.、Kishore,K.、Eldridge,M.D.、Wingett,S.、Pearson,D.、Schoenfeld,S.等人(2017),Hi‐c是精确检测和表征人类肿瘤中染色体重排和拷贝数变化的工具。基因组生物学,18(1),125。
[13] Killick,R.&Eckley,I.(2014)《变化点:变化点分析的R包》。《统计软件杂志》,58(3),1-19。
[14] Knight,P.A.&Ruiz,D.(2013)矩阵平衡的快速算法。IMA数值分析杂志,33(3),1029-1047·Zbl 1276.65025号
[15] Krietenstein,N.、Abraham,S.、Venev,S.V.、Abdennur,N.,Gibcus,J.、Hsieh,T.H.S.等人(2020)哺乳动物染色体结构的超微结构细节。分子细胞,78,554-565.e7。
[16] Kuldorff,M.(1997)空间扫描统计。统计学传播——理论与方法,26(6),1481-1496·Zbl 0920.62116号
[17] Lieberman‐Aiden,E.,Van Berkum,N.L.,Williams,L.,Imakaev,M.,Ragoczy,T.,Telling,A.等人(2009年)长期相互作用的综合绘图揭示了人类基因组的折叠原理。《科学》,326(5950),289-293。
[18] Liu,E.T.(2008)癌症的功能基因组学。遗传学与发展的当前观点,18(3),251-256。
[19] Nagarwalla,N.(1996)具有可变窗口的扫描统计。医学统计学,15(7-9),845-850。
[20] Naus,J.I.(1965)直线上最大点簇大小的分布。《美国统计协会杂志》,60(310),532-538。
[21] Naus,J.I.(1982)扫描统计分布的近似值。《美国统计协会杂志》,77(377),177-183·Zbl 0482.62010
[22] Pacifico,M.P.、Genovese,C.、Verdinelli,I.和Wasserman,L.(2007)《扫描聚类:错误发现方法》。多元分析杂志,98(7),1441-1469·Zbl 1116.62103号
[23] Parzen,E.(1962)关于概率密度函数和模式的估计。《数理统计年鉴》,33(3),1065-1076·Zbl 0116.11302号
[24] Pedeutour,F.、Simon,M.、Minoletti,F.和Barcelo,G.、Terrier‐Lacombe,M.和Combemale,P.等人(1996),隆突性皮肤纤维肉瘤中的移位,t(17;22)(q22;q13):一种新的肿瘤相关染色体重排。细胞遗传学和基因组研究,72(2-3),171-174。
[25] Perone Pacifico,M.、Genovese,C.、Verdinelli,I.和Wasserman,L.(2004)随机场的错误发现控制。《美国统计协会杂志》,99(468),1002-1014·Zbl 1055.62105号
[26] Pozdnyakov,V.、Glaz,J.、Kulldorff,M.和Steele,J.M.(2005)扫描统计的鞅方法。《统计数学研究所年鉴》,57(1),21-37·兹比尔1082.62015
[27] Rao,S.S.、Huntley,M.H.、Durand,N.C.、Stamenova,E.K.、Bochkov,I.D.、Robinson,J.T.等人(2014)千基分辨率的人类基因组三维图揭示了染色质循环的原理。细胞,159(7),1665-1680。
[28] Rosenblatt,M.(1956)关于密度函数的一些非参数估计的评论。《数理统计年鉴》,27832-837·Zbl 0073.14602号
[29] Scott,D.W.(2015)《多元密度估计:理论、实践和可视化》。新泽西州霍博肯:John Wiley&Sons·Zbl 1311.62004号
[30] Wallenstein,S.(2009)约瑟夫·瑙斯:扫描统计之父。收录:Glaz,J.(编辑)、Naus,J.I.(编辑。纽约:施普林格出版社,第1-25页。
[31] Wang,S.,Lee,S.、Chu,C.、Jain,D.、Kerpedjiev,P.、Nelson,G.M.等人(2020)HiNT:检测Hi-C数据拷贝数变化和易位的计算方法。基因组生物学,21(1),73。
[32] Wu,T.‐L.&Glaz,J.(2015)多窗口扫描统计的新自适应程序。计算统计与数据分析,82,164-172·Zbl 1507.62187号
[33] Xiao,F.,Min,X.&Zhang,H.(2014)拷贝数变化检测的改进筛选和排序算法。生物信息学,31(9),1341-1348。
[34] You,Q.,Cheng,A.Y.,Gu,X.,Harada,B.T.,Yu,M.,Wu,T.等人(2020)用cap‐c直接进行dna交联,以高分辨率揭示转录依赖性染色质组织。《自然生物技术》,39,225‐235。
[35] Zhang,N.R.,Yakir,B.,Xia,L.C.&Siegmund,D.(2016)泊松随机场扫描统计及其在基因组学中的应用。应用统计年鉴,10(2),726-755·Zbl 1400.62300号
[36] Zou,C.,Zhang,Y.&Ouyang,Z.(2016)Hsa:整合多轨道hi‐C数据,用于基因组规模的三维染色质结构重建。基因组生物学,17(1),40。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。