开放式访问
2020年6月 多分辨率Kingman–Tajima联合计数的顺序重要性采样
洛伦佐·卡佩洛,朱莉娅·帕拉西奥斯
附录申请。斯达。 14(2): 727-751 (2020年6月)。 内政部:10.1214/19-AOAS1313

摘要

根据分子序列数据对进化参数进行的统计推断依赖于合并模型来解释样本的共享谱系祖先。然而,推理算法无法扩展到可用的数据集。提高计算效率的一种策略是依赖更简单的合并和变异模型,从而产生更小的隐藏状态空间。估计不同分辨率下系谱树状态空间的基数对于确定给定数据集的最佳建模策略至关重要。据我们所知,没有一种精确或近似的方法来确定这些基数。我们提出了一种序贯重要性抽样算法来估计不同合并分辨率下谱系树样本空间的基数。我们的采样方案在数据施加的组合约束集上连续进行,在本工作中,这些数据是在非结合片段上完全链接的DNA序列。我们在模拟中分析了不同谱系树空间的基数,以研究有利于更粗分辨率的设置。我们应用我们的方法从1000个基因组的mtDNA数据和美拉尼西亚人$\beta$-珠蛋白基因座的样本中估计系谱树空间的基数。

引用

下载引文

洛伦佐·卡佩罗。 朱莉娅·帕拉西奥斯。 “多分辨率Kingman–Tajima合并计数的顺序重要性采样。” 附录申请。斯达。 14 (2) 727 - 751, 2020年6月。 https://doi.org/10.1214/19-AOAS1313

问询处

收到日期:2019年2月1日;修订日期:2019年9月1日;发布日期:2020年6月
欧几里德项目首次提供:2020年6月29日

zbMATH公司:07239881
数学科学网:MR4117827型
数字对象标识符:10.1214/19-AOAS1313

关键词:聚结,枚举,顺序重要性抽样

版权所有©2020数学统计研究所

第14卷•第2期•2020年6月
返回页首