{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“讯息”:{“索引”:{“日期-部件”:[[2024,6,10]],“日期-时间”:“2024-06-10T08:38:04Z”,“时间戳”:1718008684031},“参考-计数”:20,“出版商”:“计算机协会(ACM)”,“问题”:“3”,“许可证”:[{“开始”:{-“日期-零件”:[2017,7,19]],时间“:”2017-07-19T00:00:00Z“,“timestamp”:1500422400000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}],“funder”:[{“DOI”:“10.13039\/501100001809”,“name”:“国家科学基金”,“DOI-asserted-by”:“crossref”,“award”:[“U1435219,6130370,61402507 and 61402499”]}],“内容域”用法:{“domain”:[“dl.acm.org”],“crossmark-restriction”:true},“short-container-title”:[”acm Trans.Reconfigurable Technol.Syst.“],”published-print“:{”date-parts“:[[2017,9,30]]},”abstract“:”深度卷积神经网络(CNN)在各种计算机视觉应用中取得了巨大成功。用于大规模应用程序的最新CNN模型计算量大,内存昂贵,因此主要在服务器CPU和GPU等高性能处理器上处理。然而,在大规模集群或嵌入式系统中,对高精度或实时目标检测任务的需求越来越大,这就需要节能的加速器,因为绿色计算要求或有限的电池限制。由于能量效率和可重构性的优点,现场可编程门阵列(FPGA)作为有线电视新闻网(CNN)加速器得到了广泛的研究。在本文中,我们对每种CNN层类型的计算复杂性和内存占用进行了深入分析。然后提出了一个可扩展的并行框架,该框架在硬件加速中利用了四个级别的并行性。我们进一步提出了一种系统化的设计空间探索方法,以寻求在FPGA约束(如片上存储器、计算资源、外部存储器带宽和时钟频率)下最大化加速器吞吐量的最佳解决方案。最后,我们通过在Xilinx VC709板上优化三个具有代表性的CNN(LeNet、AlexNet和VGG-S)来演示该方法。三个加速器在100MHz工作频率下的平均性能分别为424.7、445.6和473.4GOP,显著优于CPU和以往的工作<\/jats:p>“,”DOI“:”10.1145\/3079758“,”type“:”journal-article“,”created“:{”date-parts“:[[2017,7,20]],”date-time“:”2017-07-20T17:51:24Z“,”timestamp“:1500573084000},”page“:“标题”:[“深度卷积神经网络的吞吐量优化FPGA加速器“],”前缀“:”10.1145“,”卷“:”10“,”作者“:[{”给定“:”志强“,”家族“:”刘“,”序列“:”第一“,”从属“:[}”名称“:”中国湖南长沙国防科技大学“}]},{”给出“:”勇“,”家人“:”窦“,”顺序“:”附加“,”隶属“:[[{“名称”:“中国湖南长沙国防科技大学“}]},{“given”:“Jingfei”,“family”:“Jiang”,“sequence”:“additional”,“affiliation”:[{“name”:“National University of Defense Technology,Hunan,China”{]}国防科技大学,中国湖南长沙“}]},{“给定”:“世杰”,“家族”:“李”,“序列”:“附加”,“隶属关系”:[{“名称”:“中国湖南长沙国防科技大学”}]}中国湖南长沙国防科技大学“}]},{“given”:“Yingnan”,“family”:“Xu”,“sequence”:“additional”,“affiliation”:[{“name”:“中国湖南长沙国立国防科技大学”}]}],“member”:“320”,“published-online”:{“date-parts”:[[2017,7,19]]}、“reference”:[}“key”:”e_1_1_1“,”doi-asserted-by“publisher”,“DOI“:”10.1109\/TASLP.2014.2339736“},{“key”:“e_1_1_2_1”,“DOI-asserted-by”:“publisher”,“DOI”:“10.1109\/92.784091”},},“key“:”e_2_1_3_1“,“volume-title”:“第27届国际机器学习会议(ICML\u201910)论文集”,“volution”:“,”DOI-asserted-by“:”publisher“,”DOI“:”10.1145 \/1815961.1815993“},{“key”:“e_1_2_1_5_1”,“doi-asserted-by”:“publisher”,”doi“:“10.1109 \/MICRO.2014.58”},“key“:”e_1_i_1_6_1“,”doi-assert-by“:”publisher“,“:”7“,”author“:”Denil Misha“,”year“:”2013“,”journal-title“:”神经信息处理系统的进展“},{“key”:“e_1_2_1_8_1”,“doi-asserted-by”:“publisher”,”doi“:“10.1109\/FPL.2009.5272559”},“key“:”e_1_i_1_9_1“,”doi-assert-by“:”publisher“,CVPR.2014.223“},{“键”:“e_1_2_1_11_1”,“非结构化”:“Alex Krizhevsky Ilya Sutskever和Geoffrey E.Hinton。2012.使用深度卷积神经网络进行Imagenet分类。神经信息处理系统进展。1097年至1105年。亚历克斯·克利舍夫斯基(Alex Krizhevsky)、伊利亚·萨茨克弗(Ilya Sutskever)和杰弗里·欣顿(Geoffrey E.Hinton)。2012.使用深度卷积神经网络进行Imagenet分类。神经信息处理系统进展。1097--1105.“},{”key“:”e_1_2_1_12_1“,”volume-title“:”第二十届AAAI人工智能会议论文集.2267--2273“,”author“:”Lai Siwei“,”year“:”2015“}”,{“key”:“e_1_i_1_13_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1145\/284263.2847265“}“内政部”:“10.1109\/CVPRW.2014.131”},{“key“:”e_1_2_1_15_1“,”doi断言“:”publisher“,”doi“:”10.1145\/2847263.2847276“},{”key“:”e_1_1_16_1“,”doi断言“:”publisher“,”doi“:”10.1109\/CVPR.2015.7298594“},{”key“:”e_1_1_17_1“,”doi断言“:”publisher“,”doi“:”10.1145\/22733373.2807412“},{”key“:”e_1_18_1“,”非结构化“:“赛灵思2015。Virtex7-产品表.pdf。https:\/\/www.xilinx.com/support\/documentation\/selection-guides。锡林克斯。2015年。Virtex7-product-table.pdf。https:\/\/www.xilinx.com\/support\/documentation\/selection guides。“},{”key“:”e_1_1_19_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/CVPR.2015.7298789”},“{”key“:“e_1_i_1_20_1”,“doi-assert-by”:“publisher”,”doi“:”10.1145\/2684746.2689060“}],”container-title“:[”ACM Transactions on Reconfigurable Technology and Systems“],”original-title”:[],“language”:“en”,“link”:[{“URL”“:”https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3079758“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2022,12,31]],”date-time“:“2022-12-31T08:59:06Z”,”timestamp“:167247714600},”score“:1,”resource“:”{“primary”:{“URL”:“https:\\/dl”acm.org\/doi\/10.1145\/3079758“}}”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2017,7,19]]},”引用计数“:20,”日志发布“:}”问题“:“3”,”发布-打印“:{”日期部分”:[[2017,9,30]]}},“alternative-id”:[“10.1145\/3079758”],“URL”:“http://\/dx.doi.org\/10.1145\/307958”,“关系”:{},“ISSN”:[“1936-7406”,“1936-74”],“ISSN-type”:[{“value”:“1936-7.406”,”type“:”print“},{“value“:“1936-7414”,“type”:“electronic”}],“subject”:[],“published”:{“date-parts”:[[2017,7,19]]},“assertion”:[{“value”:”2016-06-01“,“order”:0,“name”:“received”,“label”:“received”,”group“:{”name“:”publication_history“,”label“:”publication history“}},{“value”:“2017-03-01”,“orders”:1,“name:“已接受”,“组”:{“名称”:“publication_history“,”label“:”publication history“}},{”value“:”2017-07-19“,”order“:2,”name“:”published“,”标签“:”published“,”group“: