主页

论文

提交的资料

新闻

编辑委员会

特殊问题

开源软件

程序(PMLR)

数据(DMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

卷积闭分布的数据细化

Anna Neufeld、Ameer Dharamshi、Lucy L.Gao、Daniela Witten; 25(57):1−35, 2024.

摘要

我们提出了数据细化,这是一种将观测值拆分为两个或多个独立部分的方法,这些独立部分与原始观测值相加,并遵循与原始观测相同的分布,直至参数的(已知)缩放。这个非常一般的建议适用于任何卷积闭分布,这类分布包括高斯分布、泊松分布、负二项式分布、伽马分布和二项式分配等。数据细化在模型选择、评估和推断方面有许多应用。例如,通过数据细化进行交叉验证为通过样本分割进行交叉验证的常用方法提供了一种有吸引力的替代方法,尤其是在后者不适用的情况下。在模拟和单细胞RNA测序数据的应用中,我们表明,数据细化可以用于验证无监督学习方法的结果,例如k均值聚类和主成分分析,而传统的样本分割对这些方法没有吸引力或不可用。

[腹肌][pdf格式][围兜]      [代码]
©JMLR公司2024(编辑,贝塔)

乳臭虫