我们可以使用链接到您的Project Euclid帐户的电子邮件地址帮助您重置密码。
根据分子序列数据对进化参数进行的统计推断依赖于合并模型来解释样本的共享谱系祖先。然而,推理算法无法扩展到可用的数据集。提高计算效率的一种策略是依赖更简单的合并和变异模型,从而产生更小的隐藏状态空间。估计不同分辨率下系谱树状态空间的基数对于确定给定数据集的最佳建模策略至关重要。据我们所知,没有一种精确或近似的方法来确定这些基数。我们提出了一种序贯重要性抽样算法来估计不同合并分辨率下谱系树样本空间的基数。我们的采样方案在数据施加的组合约束集上连续进行,在本工作中,这些数据是在非结合片段上完全链接的DNA序列。我们在模拟中分析了不同谱系树空间的基数,以研究有利于更粗分辨率的设置。我们应用我们的方法从1000个基因组的mtDNA数据和美拉尼西亚人$\beta$-珠蛋白基因座的样本中估计系谱树空间的基数。
洛伦佐·卡佩罗。 朱莉娅·帕拉西奥斯。 “多分辨率Kingman–Tajima合并计数的顺序重要性采样。” 附录申请。斯达。 14 (2) 727 - 751, 2020年6月。 https://doi.org/10.1214/19-AOAS1313