{“status”:“ok”,“message type”:“work”,“message version”:“1.0.0”,“message”:{“indexed”:{“date parts”:[[2024,9,23]],“date-time”:“2024-09-23T04:28:58Z”,“timestamp”:1727065738010},“reference count”:0,“publisher”:“Association for the Advancement of Artificial Intelligence(AAAI)”,“issue”:“3”,“content domain”:{“domain”:[],“crossmark restriction”:false},“short container-title”:[“AAAI”],“抽象”:“层次结构在最近的视觉变换器中很流行,然而,它们需要复杂的设计和大量的数据集才能很好地工作。在本文中,我们探索了在不重叠的图像块上嵌套基本的局部变换器并以分层方式聚合它们的想法。我们发现,块聚合功能在实现跨块非本地信息通信方面起着关键作用。这一观察结果引导我们设计一个简化的体系结构,它需要对原始视觉变换器进行微小的代码更改。提出的明智选择的设计有三个好处:(1)NesT收敛更快,需要更少的训练数据,以便在ImageNet和小型数据集(如CIFAR)上实现良好的泛化;(2) 当将我们的关键思想扩展到图像生成时,NesT带来了一个强大的解码器,比以前基于变压器的生成器快8倍;(3)我们表明,通过我们设计中的这种嵌套层次结构,将特征学习和抽象过程解耦,可以构建一种新的方法(称为GradCAT)来直观地解释学习的模型。源代码可用https:\/\/github.com/google-research\/nested-transformer<\/jats:p>“,”DOI“:”10.1609\/aaai.v36i3.20252“,”type“:”journal-article“,”created“:{”date-parts“:[2022,7,4]],”date-time“:”2022-07-04T09:16:31Z“,”timestamp“:1656926191000},”page“:“3417-3425”,“source”:“Crossref”,“is-referenced-by-count”:65,“title”:[“Nested Hierarchical Transformer:Towards Accurate,Data-Eefficient and Interprepartable Visual Understanding”],“前缀”:“10.1609”,“卷”:“36”,“作者”:[{“给定”:“子照”,“家庭”:“张”,“序列”:“第一”,“隶属关系”:[]},{“给出”:“汉”,“家族”:“张”,“顺序”:“附加”,“从属关系”:[]}序列“:”附加“,”从属“:[]},{”给定“:“Sercan\u00d6.”,“family”:“Arik”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Tomas”,”family“:”Pfister“,”sequence“:”additional“,”affiliation:[]}],“member”:“9382”,“published-on-line”:{“date-parts”:[2022,6,28]]}[{“URL”:“https:\/\/ojs.aaai.org\/index.php\/aaai\/aarticle\/download\/20252\/20011”,“content-type”:“application\/pdf”,“内容版本”:“vor”,“intended-application”:“text-mining”},{“URL”:“http:\/\-ojs.aaai.org\/index.php\aaai\/article\-download \/20252\/20011”d-应用程序“:“相似性检查”}],“存放”:{“日期-部分”:[[2022,7,4]],“日期-时间”:“2022-07-04T09:16:31Z”,“时间戳”:1656926191000},“分数”:1,“资源”:{-“主资源”:}“URL”:“https:\/\/ojs.aaai.org\/index.php\/aaai\/article\/view\/20252”}},”副标题“:[],”短标题“:[],”发布“:{”日期-部分“:[[2022,6,28]]},“references-count”:0,“journal-issue”:{“issue”:“3”,“published-online”:{“date-parts”:[[2022,6,30]]}},“URL”:“http://\/dx.doi.org\/10.10609\/aaai.v36i3.20252”,“relation”:{},”ISSN“:[”2374-3468“,”2159-5399“],“ISSN-type”:[{“value”:“2374-346”,“type”:“electronic”},{“value”:“2159-539”,“类型”:“print”}],“主题”:[],“已发布”:{“日期部分”:[[2022,6,28]]}}