MLP-混合器 swMATH编号: 44031 软件作者: 伊利亚·托尔斯蒂金、尼尔·霍尔斯比、亚历山大·科尔斯尼科夫、卢卡斯·拜尔、翟小华、托马斯·恩特提纳、杰西卡·容格、安德烈亚斯·施泰纳、丹尼尔·凯泽斯、雅各布·乌斯科雷特、马里奥·卢西奇、阿列克谢·多索维茨基 描述: MLP混音器:一种全MLP视觉架构。卷积神经网络(CNN)是计算机视觉的go-to模型。最近,基于注意力的网络,如视觉变压器,也变得流行起来。在本文中,我们表明,虽然卷积和注意力都足以获得良好的性能,但两者都不是必需的。我们提出了MLP-Mixer,这是一种完全基于多层感知器(MLP)的体系结构。MLP-Mixer包含两种类型的层:一种是将MLP独立应用于图像补丁(即“混合”per-location特征),另一种是跨补丁应用MLP(即“融合”空间信息)。当在大型数据集上进行训练或使用现代正则化方案时,MLP-Mixer在图像分类基准上获得竞争性分数,预训练和推理成本与最先进的模型相当。我们希望这些结果能够激发出超越成熟CNN和变形金刚领域的进一步研究。 主页: https://arxiv.org/abs/2105.01601 关键词: 计算机视觉;模式识别;arXiv_cs。个人简历;人工智能;arXiv_cs。人工智能;机器学习;arXiv_cs。LG公司;CNN编号 相关软件: BERT(误码率);GPT-3级;张紧器2传感器;Swin变压器;ViT公司;ResMLP公司;效率网;ImageNet公司;时尚-MNIST;MNIST公司;SVM灯;UCI-毫升;DeepSpeed公司;变压器;ELECTRA公司;Linformer公司;国际货币数据库;GNMT公司;F网络;分散大脑 引用于: 8文件 全部的 前5名28位作者引用 1 扎赫拉·阿塔什加希 1 马尔科·贝托尼亚 1 卞,江 1 朱利奥·比罗利 1 圣埃芬阿斯科利 1 卡里姆·穆塔瓦基尔 1 阿卜杜拉提夫·埃尔·乌伊萨里 1 阿什坎·法汉吉 1 乔治·弗朗西尼 1 雷米·格里波瓦尔 1 郭志山 1 阿瑟·C·黄。 1 马修·莱维特。 1 刘世伟 1 莫卡努(Decebal Constantin Mocanu) 1 阿里·莫科斯。 1 Jumpei长濑 1 Mykola Pechenizkiy 1 乔斯特·彼得斯 1 马尔科·普拉托 1 伊丽莎·里切蒂 1 莱文特·萨贡 1 卡梅洛·斯克里巴诺 1 理查德·塞利斯基 1 雨果·图夫龙 1 新泽西州雷蒙德·维尔杜斯。 1 熊浩毅 1 Léon郑 全部的 前5名8篇连载文章中引用 1 科学计算杂志 1 机器学习 1 日本工业与应用数学杂志 1 数据挖掘与知识发现 1 RAIRO公司。运筹学 1 统计力学杂志:理论与实验 1 计算机科学课文 1 SIAM数据科学数学杂志 全部的 前5名在8个字段中引用 4 计算机科学(68至XX) 2 统计学(62-XX) 1 线性代数和多线性代数;矩阵理论(15-XX) 1 数值分析(65-XX) 1 统计力学,物质结构(82-XX) 1 运筹学、数学规划(90-XX) 1 系统论;控制(93至XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文