×

复制模型中族大小的幂律。 (英语) Zbl 1099.92055号

基因组中蛋白质折叠的多样性是一个多类型的Yule过程,从一个个体开始。每个个体以1的速度生下一个新个体。当一个新的个体出生时,它与它的父母具有相同的类型,概率为(1-r),并且是一个新类型,与之前观察到的所有类型不同,概率为。同一类型的个体称为家庭。基于Yule过程和Pólya urns之间的联系,导出了种群规模达到N时联合家族分布的近似值。结果表明,如果\(1\llS\llN^{1-r}\),那么至少\(S\)大小的族的数量大约为\(text{CNS}^{-1(1-r)}\)。导出了大族尺寸的极限分布,并证明了如果(N^{1-r}\llS),则尺寸至少为(S)的族的期望数量衰减得比任何幂都快。结果表明,该模型与“中餐厅流程”密切相关。讨论了优先依恋模型的联系。

MSC公司:

92D15型 与进化有关的问题
60J80型 分支过程(Galton-Watson、出生和死亡等)
60J85型 分支过程的应用
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aldous,D.J.(2001)。Yule到今天的系统发育树的随机模型和描述性统计。统计师。科学。16 23–34. ·Zbl 1127.60313号 ·doi:10.1214/ss/98929474
[2] 安格尔,W.P.(2001)。Luria–Delbrück分布的显式表示。数学杂志。生物。42 145–174·兹比尔1009.92028 ·doi:10.1007/s002850000053
[3] Angerer,W.P.和Wakolbinger,A.(2005)。正在准备中。
[4] Arratia,R.、Barbour,A.D.和Tavaré,S.(2000年)。对数组合结构的极限。安·普罗巴伯。28 1620–1644. ·Zbl 1044.60003号 ·doi:10.1214/aop/1019160500
[5] Arratia,R.和Gordon,L.(1989)。二项分布大偏差教程。牛市。数学。生物学51 125–131·Zbl 0663.60028号 ·doi:10.1007/BF02458840
[6] Athreya,K.B.和Karlin,S.(1968年)。将urn方案嵌入到连续时间Markov分支过程中。安。数学。统计师。39 1801–1817. ·Zbl 0185.46103号 ·doi:10.1214/aoms/1177698013
[7] Athreya,K.B.和Ney,P.E.(1972年)。分支流程。柏林施普林格·兹比尔0259.60002
[8] Barbási,A.L.和Albert,R.(1999)。随机网络中尺度的出现。科学286 509–512·Zbl 1226.05223号 ·doi:10.1126/science.286.5439.509
[9] Berger,N.、Borgs,C.、Chayes,J.和Saberi,A.(2005年)。关于病毒在互联网上的传播。在第16届ACM-SIAM离散算法研讨会论文集301-310。宾夕法尼亚州费城SIAM·Zbl 1297.68029号
[10] Bollobás,B.、Borgs,C.、Chayes,J.和Riordan,O.(2003年)。有向无标度图。第14届ACM-SIAM离散算法研讨会论文集132–139。宾夕法尼亚州费城SIAM·Zbl 1094.68605号
[11] Bollobás,B.、Riordan,O.、Spencer,J.和Tusnády,G.(2001年)。无标度随机图过程的度序列。随机结构算法18 279–290·Zbl 0985.05047号 ·doi:10.1002/rsa.1009
[12] Cooper,C.和Frieze,A.(2003年)。网络图的通用模型。随机结构算法22 311–335·Zbl 1018.60007号 ·doi:10.1002/rsa.10084
[13] Durrett,R.(1996)。《概率:理论与实例》,第二版,加利福尼亚州贝尔蒙特市达克斯伯里·Zbl 1202.60001号
[14] Durrett,R.(2002)。DNA序列进化的概率模型。纽约州施普林格·Zbl 0991.92021号
[15] Durrett,R.和Schweinsberg,J.(2004)。近似选择扫描。定理。人口生物学。66 129–138. ·Zbl 1111.92042号 ·doi:10.1016/j.tpb.2004.04.002
[16] W.J.Ewens(1972年)。选择性中性等位基因的抽样理论。定理。人口生物学。3 87–112. ·Zbl 0245.92009号 ·doi:10.1016/0040-5809(72)90035-4
[17] Gu,Z.、Cavalcanti,A.、Chen,F.-C.、Bouman,P.和Li,W.-H.(2002)。果蝇、线虫和酵母基因组中的基因复制程度。分子生物学。进化。19 256–262.
[18] Harrison,P.M.和Gerstein,M.(2002年)。古往今来研究基因组:蛋白质家族、假基因和蛋白质组进化。分子生物学杂志。318 1155–1174.
[19] Huynen,M.A.和van Nimwegen,E.(1998年)。全基因组中基因家族大小的频率分布。分子生物学。进化。15 583–589.
[20] Janson,S.(2004)。多类型分支过程和广义Pólya urns的泛函极限定理。随机过程。申请。110 177–245. ·Zbl 1075.60109号 ·doi:10.1016/j.spa.2003.12.002
[21] Janson,S.(2004年)。三角urn格式的极限定理。预打印。可在网址://www。math..uu.se/svant/papers/index.html·Zbl 1112.60012号 ·doi:10.1007/s00440-005-0442-7
[22] Johnson,N.L.、Kotz,S.和Kemp,A.W.(1992年)。单变量离散分布。威利,纽约·Zbl 0773.62007号
[23] Karev,G.P.、Wolf,Y.I.、Rzhetsky,A.Y.、Berezov,F.S.和Koonin,E.V.(2002)。蛋白质结构域的诞生和死亡:一个简单的模型解释幂律行为。BMC进化生物学2第18条。
[24] Kingman,J.F.C.(1982年)。融合。随机过程。申请。13 235–248. ·Zbl 0491.60076号 ·doi:10.1016/0304-4149(82)90011-4
[25] Koonin,E.V.、Wolf,Y.I.和Karev,G.P.(2002年)。蛋白质宇宙的结构和基因组进化。自然420 218–223。
[26] Krapivsky,P.L.、Redner S.和Leyvraz,F.(2000)。不断增长的随机网络的连接性。物理学。修订稿。85 4629–4632.
[27] Kumar,R.、Raghavan,P.、Rajagopalan,S.、Sivakumar,D.、Tomkins,A.和Upfal,E.(2000)。网络图的随机模型。第41届IEEE计算机科学基础研讨会论文集57-65。
[28] Li,W.-H.,Gu,Z.,Wang,H.和Nekrutenko,A.(2001)。人类基因组的进化分析。自然409 847–849·兹比尔1019.81044 ·doi:10.1088/0305-4470/34/49/320
[29] Pitman,J.(1995)。可交换和部分可交换的随机分区。普罗巴伯。理论相关领域102 145–158·Zbl 0821.60047号 ·doi:10.1007/BF01213386
[30] Pitman,J.(2002)。组合随机过程。圣弗洛尔暑期学校的讲稿。可在http://stat-www.berkeley.edu/users/pitman/bibliog.html。
[31] Pitman,J.和Yor,M.(1997)。双参数泊松-狄利克雷分布是从一个稳定的从属子函数导出的。安·普罗巴伯。25 855–900. ·Zbl 0880.60076号 ·doi:10.1214/aop/1024404422
[32] Qian,J.、Luscombe,N.M.和Gerstein,M.(2001)。蛋白质家族和基因组中折叠的发生:幂律行为和进化模型。分子生物学杂志。313 673–681.
[33] Rzhetsky,A.和Gomez,S.M.(2001年)。无标度分子网络的诞生以及每个基因组不同DNA和蛋白质结构域的数量。生物信息学17 988–996。
[34] Schweinsberg,J.和Durrett,R.(2004)。在选择性扫描期间,近似于谱系合并的随机分割。预打印。可在http://front.math.ucdavis.edu/math.PR/ 0411069. ·Zbl 1073.92029号 ·doi:10.1214/10505160500000430
[35] Simon,H.A.(1955年)。关于一类斜分布函数。生物特征42 425–440·Zbl 0066.11201号 ·doi:10.1093/biomet/42.3-4.425
[36] Skorohod,A.V.(1961年)。稳定分布律的渐近公式。数理统计与概率翻译选集1 157–161·Zbl 0112.10107号
[37] 尤尔·G·U(1925)。基于J.C.Willis博士结论的进化数学理论。菲洛斯。事务处理。罗伊。Soc.伦敦Ser。B 213 21–87。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。