提高GPU上真实世界变压器推断的计算和存储效率
基于ReRAM的CIM体系结构中用于计算卸载的编译工具
使用Franca语言的高性能确定性并发
克里斯蒂安·梅纳德 , 马丁·洛斯特罗 , 索鲁什·巴泰尼 , 马修·乔里安 , 阿瑟·登 , 彼得·多诺万 , 克莱门特·福尼尔 , 林少凯 , 费利克斯·苏切特 , 塔西尔·坦尼伯格 , Hokeun Kim公司 , 杰罗尼莫·卡斯特里隆 , 爱德华·A·李
智能DNN+:一种用于模型推理的高效记忆神经网络压缩框架
MicroProf:微服务应用程序中不必要数据传输的代码级属性
gPPM:一种加速擦除码编解码过程的广义矩阵运算和并行算法
PARALiA:异构系统上自动调整线性代数的性能感知运行时
RACE:一种高效的动态图神经网络冗余软件加速器
利用卷积切片优化和ISA扩展推进直接卷积
DxPU:数据中心中的大规模非聚合GPU池
在性能所在地:量化Copious 3D-Stacked Cache对HPC工作负载的影响
延斯·多姆克 , 埃米尔·瓦泰 , 巴拉兹·杰罗菲 , Yuetsu Kodama公司 , 穆罕默德·瓦希卜 , 阿图尔·波多巴斯 , 斯帕什·米塔尔 , Miquel Pericás公司 , 张玲琦 , 陈鹏(音) , 亚历克桑德·德罗兹德 , 松冈佐治
Mapi-Pro:一种用于间歇计算的节能内存映射技术
乘法与火灾:事件驱动稀疏神经网络加速器
FlowPix:使用领域特定编译器加速FPGA覆盖上的图像处理管道
ULEEN:一种新型超低能量边缘神经网络结构
扎卡里·苏斯金德 , 阿曼·阿罗拉 , 伊戈尔·D·S·米兰达 , 艾伦·T·L·杆菌 , 路易斯·A·Q·维隆 , 拉斐尔·卡托波迪斯 , 莱安德罗·德·阿劳霍 , 迭戈·L·C·杜特拉 , Priscila M.V.利马 , 菲利佩·M·G·弗朗萨 , 小莫里西奥·布雷特尼茨。 , 莉齐·K·约翰