×

Hawkes过程的自适应估计;应用于基因组分析。 (英语) Zbl 1200.62135号

摘要:本文的目的是提供一种新的方法来检测DNA序列上基因组事件之间的有利或避免距离。这些事件由霍克斯过程建模[参见A.G.霍克斯D.橡树,J.应用。普罗巴伯。11, 493–503 (1974;Zbl 0305.60021号)]. 生物问题实际上非常复杂,需要一种非症状惩罚模型选择方法。我们提供了一个理论惩罚,即使对于相当复杂的模型族,也满足预言不等式。对于(1/2,1]中正则的Hölder函数,连续理论估计被证明是自适应极小极大的:对于Hawkes过程,这些方面还没有被研究岛屿,这在模型选择中不是经典的用法,但这恰好与我们想要回答的生物学问题特别相关。由于理论惩罚中的乘法常数在实践中是不可计算的,因此我们提供了广泛的模拟来找到该常数的数据驱动校准。在真实基因组数据上获得的结果与生物学知识一致,并最终对其进行完善。

理学硕士:

第62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
65立方厘米60 统计中的计算问题(MSC2010)
62G05型 非参数估计
6220国集团 非参数推理的渐近性质
60埃15 不平等;随机排序
46号30 泛函分析在概率论和统计学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arlot,S.和Massart,P.(2009年)。数据驱动的最小二乘回归惩罚校准。J.马赫。学习。第10号决议245-279。
[2] Baraud,Y.、Comte,F.和Viennet,G.(2001年)。具有相关数据的(自动)回归模型选择。ESAIM概率。统计数字5 33-49·Zbl 0990.62035号 ·doi:10.1051/ps:2001101
[3] Baraud,Y.、Comte,F.和Viennet,G.(2001年)。通过模型选择在自回归或β-混合回归中进行自适应估计。安。统计师。39 839-875. ·Zbl 1012.62034号 ·doi:10.1214/aos/1009210692
[4] Birgé,L.(2005)。多重假设检验的新下界。IEEE传输。通知。理论51 1611-1615·Zbl 1283.62030 ·doi:10.1109/TIT.2005.844101
[5] Birgé,L.和Massart,P.(2001)。高斯模型选择。《欧洲数学杂志》。Soc.(JEMS)3 203-268·Zbl 1037.62001 ·doi:10.1007/s100970100031
[6] Birgé,L.和Massart,P.(2007年)。高斯模型选择的最小惩罚。普罗巴伯。理论相关领域138 33-73·Zbl 1112.62082号 ·doi:10.1007/s00440-006-0011-8
[7] Brémaud,P.和Massoulié,L.(1996)。非线性Hawkes过程的稳定性。Ann.遗嘱认证。24 1563-1588. ·Zbl 0870.60043号 ·doi:10.1214/aop/1065725193
[8] Brémaud,P.和Massoulié,L.(2001)。没有祖先的霍克斯分支点过程。J.应用。普罗巴伯。38 122-135. ·Zbl 0983.60048号 ·doi:10.1239/jap/996986648
[9] Daley,D.J.和Vere-Jones,D.(2005年)。点过程理论导论。统计I中的斯普林格系列。纽约州施普林格·Zbl 0657.60069号
[10] Gallager,R.(1968)。信息理论与可靠通信。纽约威利·Zbl 0198.52201号
[11] Gusto,G.(2004)。霍克斯-格雷斯过程的强度估计加倍。主题的应用是为了延续ADN的连续性。巴黎大学博士论文。网址:。
[12] Gusto,G.和Schbath,S.(2005年)。FADO:一种统计方法,使用霍克斯模型检测模体发生之间的偏好或避免距离。统计应用程序。遗传学。分子生物学。4第24条,28页(电子版)·Zbl 1095.62126号 ·doi:10.2202/1544-6115.1119
[13] 霍克斯,A.G.和奥克斯,D.(1974年)。自我激励过程的集群过程表示。J.应用。普罗巴伯。11 493-503. JSTOR公司:·Zbl 0305.60021号 ·doi:10.2307/3212693
[14] Lacour,C.(2007)。马尔可夫链转移密度的自适应估计。Ann.Inst.H.PoincaréProbab公司。统计师。43 571-597. ·Zbl 1125.62087号 ·doi:10.1016/j.anihpb.2006.09.003
[15] Massart,P.(2007年)。集中不等式与模型选择。数学课堂笔记。1896 . 柏林施普林格·Zbl 1170.60006号 ·doi:10.1007/978-3-540-48503-2
[16] Ogata,Y.和Akaike,H.(1982年)。混合双随机泊松和自激点过程的线性强度模型。J.罗伊。统计师。Soc.序列号。B 44 102-107。JSTOR公司:·兹伯利0496.62074
[17] Ozaki,T.(1979)。霍克斯自激点过程的最大似然估计。Ann.Inst.统计。数学。31 145-155. ·Zbl 0447.62081号 ·doi:10.1007/BF02480272
[18] Reinert,G.、Schbath,S.和Waterman,M.S.(2000年)。单词的概率和统计特性:概述。J.计算。生物7 1-46。
[19] Reynaud-Bouret,P.(2003年)。通过浓度不等式自适应估计非均匀泊松过程的强度。普罗巴伯。理论相关领域126 103-153·Zbl 1019.62079号 ·doi:10.1007/s00440-003-0259-1
[20] Reynaud-Bouret,P.(2006年)。计数过程上确界的补偿器和指数不等式。统计师。普罗巴伯。莱特。76 1514-1521. ·Zbl 1101.60033号 ·doi:10.1016/j.spl.2006.03.012
[21] Reynaud-Bouret,P.(2006年)。阿伦乘法强度的惩罚投影估计。伯努利12 633-661·Zbl 1125.62027号 ·doi:10.3150/bj/1155735930
[22] Reynaud-Bouret,P.和Roy,E.(2007年)。Hawkes过程的一些非共态尾估计。牛市。贝尔格。数学。Soc.西蒙·斯特文13 883-896·Zbl 1120.60052号
[23] Reynaud-Bouret,P.和Schbath,S.(2010年)。霍克斯过程的自适应估计;应用于基因组分析。可从获取·Zbl 1200.62135号
[24] Vere-Jones,D.和Ozaki,T.(1982年)。统计估计应用于地震数据的一些例子。Ann.Inst.统计。数学。34 189-207.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。