在许多统计方法中,对象之间在对一组变量的观察方面的差异程度起着重要作用。许多数据分析方法需要量化观测值之间的差异,我们可以称之为距离。适当的距离定义取决于数据的性质和手头的问题。对于数值变量之间的距离,存在许多取决于观测差异大小的定义。对于分类数据,距离的定义更为复杂,因为没有直接量化观测差异的大小。本文介绍了一个灵活的框架,用于有效计算类别变量之间的距离,支持根据特定上下文定制的现有和新公式。在监督分类中,它通过整合响应和预测变量之间的关系来提高性能。此框架允许跨不同数据类型和域测量对象之间的差异。
原始语言 | 英语 |
---|
文章编号 | 110547 |
---|
日记账 | 模式识别 |
---|
体积 | 153 |
---|
早期在线日期 | 2024年5月6日 |
---|
内政部 | |
---|
出版物状态 | 打印前电子发布-2024年5月6日 |
---|
©2024作者。爱思唯尔有限公司出版。