×

MLP-混合器

swMATH编号: 44031
软件作者: 伊利亚·托尔斯蒂金、尼尔·霍尔斯比、亚历山大·科尔斯尼科夫、卢卡斯·拜尔、翟小华、托马斯·恩特提纳、杰西卡·容格、安德烈亚斯·施泰纳、丹尼尔·凯泽斯、雅各布·乌斯科雷特、马里奥·卢西奇、阿列克谢·多索维茨基
描述: MLP混音器:一种全MLP视觉架构。卷积神经网络(CNN)是计算机视觉的go-to模型。最近,基于注意力的网络,如视觉变压器,也变得流行起来。在本文中,我们表明,虽然卷积和注意力都足以获得良好的性能,但两者都不是必需的。我们提出了MLP-Mixer,这是一种完全基于多层感知器(MLP)的体系结构。MLP-Mixer包含两种类型的层:一种是将MLP独立应用于图像补丁(即“混合”per-location特征),另一种是跨补丁应用MLP(即“融合”空间信息)。当在大型数据集上进行训练或使用现代正则化方案时,MLP-Mixer在图像分类基准上获得竞争性分数,预训练和推理成本与最先进的模型相当。我们希望这些结果能够激发出超越成熟CNN和变形金刚领域的进一步研究。
主页: https://arxiv.org/abs/2105.01601
关键词: 计算机视觉;模式识别;arXiv_cs。个人简历;人工智能;arXiv_cs。人工智能;机器学习;arXiv_cs。LG公司;CNN编号
相关软件: BERT(误码率);GPT-3级;张紧器2传感器;Swin变压器;ViT公司;ResMLP公司;效率网;ImageNet公司;时尚-MNIST;MNIST公司;SVM灯;UCI-毫升;DeepSpeed公司;变压器;ELECTRA公司;Linformer公司;国际货币数据库;GNMT公司;F网络;分散大脑
引用于: 8文件

按年份列出的引文