跳到主要内容
10.1145/3316781.3322472acm会议文章/章节视图摘要出版物页面数模转换器会议记录会议集合
研究论文
公共访问

LODESTAR公司:创建局部感知CNN以有效推断收缩阵列

出版:2019年6月2日 出版历史
  • 获取引文提醒
  • 摘要

    稀疏问题的性能受到缺乏空间局部性和低内存带宽利用率的影响。然而,一类稀疏问题(如神经网络中的矩阵运算)的数据结构中非零值的分布是可以修改的,以便与有效的底层硬件(如脉动阵列)匹配。这种修改有助于解决稀疏性带来的挑战。为了有效地在脉动阵列上执行稀疏神经网络推理,我们提出了一种结构化剪枝算法,该算法增加了神经网络模型的空间局部性,同时保持推理的准确性。

    工具书类

    [1]
    Anwar,S.等人,《深层树干的结构化修剪》。JETC 13,3(2017),32。
    [2]
    Asgari,B.等人。内存片:可扩展智能内存系统的模块化构建块。arXiv预印arXiv:1803.06068(2018)。
    [3]
    Chetlur,S.等人:深度学习的有效原语。arXiv:1410.0759。
    [4]
    Hadjis,S.等人,《咖啡控制:加快深度学习的浅薄想法》。《云数据分析第四次研讨会论文集》(2015年),ACM。
    [5]
    Han,S.等。深度压缩:使用剪枝、训练量化和哈夫曼编码压缩深度神经网络。arXiv:1510.00149(2015)。
    [6]
    Jouppi,N.P.等人。张量处理单元的数据中心内性能分析。在ISCA(2017),IEEE,第1-12页。
    [7]
    Kung,H.-T.为什么是收缩结构?IEEE计算机15,1(1982),37-46。
    [8]
    Li,H.等。高效卷积的剪枝滤波器。arXiv:1608.08710(2016)。
    [9]
    Mao,H.等。探索cnns中稀疏结构的规律。arXiv:1705.08922。
    [10]
    Molchanov,P.等人。资源高效推理的卷积神经网络剪枝。arXiv:1611.06440。
    [11]
    Wen,W.,等。学习dnns中的结构化稀疏性。在NIPS(2016)中。

    引用人

    查看全部
    • (2023)用于大规模TDM-MIMO雷达的高吞吐量无超参数稀疏源定位:算法和FPGA实现IEEE地球科学和遥感汇刊10.1109/TGRS.2023.332351761(1-14)在线发布日期:2023年
    • (2023)TREAD-M3D:用于单片3-D移动系统的温度软件DNN加速器IEEE集成电路和系统计算机辅助设计汇刊10.1109/TCAD.2023.328503942:12(4350-4363)在线发布日期:2023年12月
    • (2023)具有虚拟化的资源约束机器人中的上下文软件任务处理2023 IEEE边缘计算与通信国际会议(Edge)10.1109/EDGE60047.2023.00047(255-261)在线发布日期:2023年7月
    • 显示更多引用者

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    DAC’19:2019年第56届设计自动化年会会议记录
    2019年6月
    1378页
    国际标准图书编号:9781450367257
    内政部:10.1145/3316781
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    赞助商

    合作中

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2019年6月2日

    权限

    请求对此文章的权限。

    检查更新

    限定符

    • 研究文章
    • 研究
    • 推荐有限公司

    资金来源

    会议

    19年DAC
    赞助商:
    DAC’19:2019年第56届设计自动化年会
    2019年6月2-6日
    内华达州,美国拉斯维加斯

    接受率

    5499份提交文件的总体接受率为1770,32%

    即将召开的会议

    25年DAC
    第62届ACM/IEEE设计自动化会议
    2025年6月22日至26日
    旧金山,加利福尼亚州,美国

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)61
    • 下载次数(最近6周)

    其他指标

    引文

    引用人

    查看全部
    • (2023)用于大规模TDM-MIMO雷达的高吞吐量无超参数稀疏源定位:算法和FPGA实现IEEE地球科学和遥感汇刊10.1109/TGRS.2023.332351761(1-14)在线发布日期:2023年
    • (2023)TREAD-M3D:用于单片3-D移动系统的温度软件DNN加速器IEEE集成电路和系统计算机辅助设计汇刊10.1109/TCAD.2023.328503942:12(4350-4363)在线发布日期:2023年12月
    • (2023)具有虚拟化的资源受限机器人中的上下文感知任务处理2023 IEEE边缘计算与通信国际会议(Edge)10.1109/EDGE60047.2023.00047(255-261)在线发布日期:2023年7月
    • (2023)利用并行结构减少边缘图像识别的推理延迟2023 IEEE边缘计算与通信国际会议(Edge)10.1109/EDGE60047.2023.00046(245-254)在线发布日期:2023年7月
    • (2023)使用编码分布式计算为物联网创建鲁棒的深度神经网络2023 IEEE边缘计算与通信国际会议(Edge)10.1109/EDGE60047.2023.00029(126-132)在线发布日期:2023年7月
    • (2023)Spica:探索FPGA优化以实现边缘计算的高效SpMV实现2023 IEEE边缘计算与通信国际会议(Edge)10.1109/EDGE60047.2023.00018(36-42)在线发布日期:2023年7月
    • (2023)FASS修剪器:通过滤波器内拆分和滤波器间混洗定制细粒度的CNN加速器感知修剪框架CCF高性能计算事务10.1007/s42514-023-00156周5:3(292-303)在线发布日期:2023年5月26日
    • (2022)ProSE:蛋白质发现引擎的架构和设计第27届ACM国际编程语言和操作系统体系结构支持会议记录10.1145/3503222.3507722(655-668)在线发布日期:2022年2月28日
    • (2021)用于高效CNN的重量整形和收缩阵列复用的软硬件协同设计2021年欧洲会议展览设计、自动化和测试(DATE)10.23919/日期51398.2021.9474215(667-672)在线发布日期:2021年2月1日
    • (2021)在部分可重构专用硬件中高效求解偏微分方程电气电子工程师学会计算机期刊10.1109/TC.2021.3060700号70:4(524-538)在线发布日期:2021年4月1日
    • 显示更多引用者

    视图选项

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    获取访问权限

    登录选项

    完全访问权限

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享