2018年第12届ACA:中国营口
李超(音) , 吴俊杰 :
高级计算机体系结构第12届会议,ACA 2018,中国营口,2018年8月10日至11日,会议记录。 计算机与信息科学中的通信 908, 施普林格 2018 ,国际标准图书编号 978-981-13-2422-2
加速器
柯旭 , 王晓云 , Shihang Fu公司 , 董旺(Dong Wang) :
用于卷积神经网络的可扩展FPGA加速器。 3-14 聂子恺 , 李志胜 , 王磊(Lei Wang) , 郭沙沙 , 羌斗 :
深度卷积神经网络加速器的存储带宽和能效优化。 15-29 朱克谦 , 姜静飞 :
基于多核ARM平台的深度学习推理并行加速研究。 30-41 梁白 , 姜静飞 , 勇斗 :
语音识别训练的加速方法研究。 42-50
新设计探索
魏红梅 , 王飞(音译) , 李忠生 :
基于事件采样的链接后预取。 53-65 金庸尹 , 许振鹏 , 新磨坊 , 周希浩(Xihao Zhou) :
基于ARM体系结构的可重构指令集处理器的设计。 66-78 Jun Zhang(张军) , 芮侯 , 魏松 , Zhiyuan Zhan先生 , 赵伯彦 , 陈明宇 , 丹蒙 :
Intel MPX的状态前向边缘CFI强制。 79-94 云亮(Yun Liang) , Shuo Wang(王朔) , 图利卡·米特拉 , 雅君哈 :
低功耗生物医学应用的分析型两级近阈值缓存探索。 95-108 詹旭升 , 云冈包 , 孙宁辉 :
DearDRAM:丢弃弱行以减少DRAM的刷新开销。 109-124年
实现高效ML/AI
李伟成 , 丹佳 , 贾寨 , 蔡继红 , 韩章(Han Zhang) , 张连怡 , 杨海龙 , 钱德培 , 王瑞(Rui Wang) :
EffectFace:一种快速高效的深度神经网络人脸识别模型。 127-139 王树泉 , 郭沙沙 , 王磊(Lei Wang) , 南丽 , 聂子恺 , 于登 , 羌斗 , 徐伟霞 :
中频神经元模型的一种高效硬件实现。 140年至154年 沈小龙 , 宋河 , 民权坊 , 宇奇文 , 小陈博 , 勇斗 :
paraSNF:一种大规模相似网络融合的并行方法。 155-167 陆家印 , 陈晓涛 , 郑琴 , 张兆宁 , 冯京华 , 李东生 :
计算效率神经网络训练的实验视角。 168-178
并行计算系统
陈珊珊 , 周旭东 , 周桂平 , 理查德·辛诺特 :
可扩展键值缓存系统的分布式数据负载平衡。 181-194 新友 , 杨海龙 , 中植栾 , 钱德培 :
RELION-2中Cyro-EM结构确定的性能分析与优化。 195-209 张敏(音) :
向后容错方案的检查点计时。 210-218 冯京华 , 刘光明 , 张志伟 , 陶莉 , 李宇奇 , 复兴太阳 :
商业超级计算机中配额约束的作业提交行为。 219-231