计算机工程与应用››2023,第59卷››问题(3): 13-22.内政部:10.3778/j.issn.1002-8331.2207-0179

• 热点与综述 • 上一篇   下一篇

数据归一化方法综述

杨寒雨,赵晓永,王磊  

  1. 1北京信息科技大学 信息管理学院,北京 100129
    2.北京信息科技大学 北京材料基因工程高精尖创新中心,北京 100129
  • 出版日期:2023-02-01 发布日期:2023-02-01

数据规范化方法综述

杨汉玉、赵晓勇、王磊  

  1. 1.北京信息科技大学信息与管理学院,中国北京100129
    2.北京信息科技大学北京材料基因组工程先进创新中心,北京100129
  • 在线:2023-02-01 出版:2023-02-01

摘要:当今,人工智能已经广泛应用到各个领域中,并取得了显著的效果。数据归一化是人工智能应用落地中的一个重要环节,它有助于避免神经网络因数据量纲的复杂性对数据进行错误建模。在大数据场景下,相当一部分数据是以流的形式先后到达训练点,所以在流场景下数据归一化研究是当前亟待解决的关键问题。目前关于归一化研究的综述较多,大多仅仅针对于批数据的归一化研究,而缺乏对流数据的归一化方法的总结,不具参考性。在批数据归一化研究基础之上,系统化整理并详尽分析了流数据归一化的相关文献,凝练提出了基于流数据的归一化分类方法,并将数据归一化方法划分为批数据的归一化方法和流数据的归一化方法。同时,对这些方法的原理、优势和可以解决的主要问题进行了对比分析,在不同场景下对数据归一化的未来研究方向进行了展望。

关键词: 归一化, 数据流, 深度学习, 数据挖掘

摘要:近年来,人工智能在各个领域得到了广泛的应用,并取得了显著的成果。数据规范化是人工智能应用实现的重要组成部分,有助于避免由于数据维度的复杂性而导致神经网络对数据的错误建模。在大数据场景中,一部分数据以流的形式依次到达训练点。因此,流场景下的数据规范化研究是一个亟待解决的核心问题。目前,对归一化研究的综述很多,其中大多数只关注批量数据的归一化,缺乏对流数据归一化方法的总结,信息量不大。本文系统、详尽地分析了基于批处理数据规范化的流数据规范化文献,浓缩并提出了一种基于流数据的规范化分类方法,并将数据规范化方法分为批处理数据标准化方法和流数据标准化方法。同时,本文对这些方法的原理、优点以及可以解决的主要问题进行了比较分析。最后,展望了不同场景下数据规范化的未来研究方向。

关键词: 标准化, 数据流, 深度学习, 数据挖掘