实现分类变量距离的一般框架

米歇尔·范德维尔登阿方索·伊奥迪丝·德恩扎、安吉洛斯·马科斯,卡洛·卡维奇*

*此作品的通讯作者

研究成果:对日记账的贡献第条学术同行审查

4 下载(纯)

摘要

在许多统计方法中,对象之间在对一组变量的观察方面的差异程度起着重要作用。许多数据分析方法需要量化观测值之间的差异,我们可以称之为距离。适当的距离定义取决于数据的性质和手头的问题。对于数值变量之间的距离,存在许多取决于观测差异大小的定义。对于分类数据,距离的定义更为复杂,因为没有直接量化观测差异的大小。本文介绍了一个灵活的框架,用于有效计算类别变量之间的距离,支持根据特定上下文定制的现有和新公式。在监督分类中,它通过整合响应和预测变量之间的关系来提高性能。此框架允许跨不同数据类型和域测量对象之间的差异。
原始语言英语
文章编号110547
日记账模式识别
体积153
早期在线日期2024年5月6日
内政部
出版物状态打印前电子发布-2024年5月6日

参考文献注释

©2024作者。爱思唯尔有限公司出版。

研究项目

  • ESE-环境与管理体系

伊拉斯谟部门计划

  • 部门计划SSH-标杆

指纹

深入研究“实现类别变量距离的一般框架”的研究主题。它们一起形成了一个独特的指纹。

引用这个