×

处理缺失数据:基于模糊集和粗糙集理论的算法。 (英语) 兹比尔1136.68532

Peters,James F.(编辑)等人,《粗糙集学报》第四卷,柏林:施普林格出版社(ISBN 978-3-540-29830-4/pbk)。计算机科学3700课堂讲稿。《期刊副刊》,37-57(2005)。
摘要:数据缺失是许多研究领域中常见的问题,导致分析和评估不准确。以前用于处理缺失数据的方法(例如,删除信息不完整的案例,或用估计的平均得分替换缺失值)虽然易于实施,但存在问题,因为这些方法可能会导致数据模型有偏差。幸运的是,理论统计和计算统计的最新进展导致了处理缺失数据问题的更灵活的技术。本文提出了基于聚类的缺失数据插补方法,聚类是数据库知识发现(KDD)中最流行的技术之一。我们将聚类与软计算相结合,软计算往往更能容忍不精确和不确定性,并应用模糊和粗糙聚类算法处理不完整数据。实验表明,在缺失数据插补算法中,模糊集和粗糙集理论的混合使得我们的四种插补算法(即crisp(K)-means、fuzzy(K)-means、rough(K)-means和rough-fuzzy(K\)-means)插补算法的性能最佳。
关于整个系列,请参见[Zbl 1131.68013号].

MSC公司:

68层37 人工智能背景下的不确定性推理
PDF格式BibTeX公司 XML格式引用
全文: 内政部