第30届PACT 2021:美国佐治亚州亚特兰大
李政宰 , 阿尔伯特·柯恩 :
第30届并行体系结构和编译技术国际会议,PACT 2021,美国佐治亚州亚特兰大,2021年9月26-29日。 电气与电子工程师协会 2021 ,国际标准图书编号 978-1-6654-4278-7 周敏轩 , 陈国洋(音) , 莫森·伊马尼 , 萨兰斯·古普塔 , 张伟峰 , 塔贾娜·罗辛 :
PIM-DL:通过数据布局优化提高数字处理内存体系结构的DNN推断。 1 Phitchaya Mangpo Phothilimthana公司 , 阿米特·萨本 , 尼基尔·萨达 , 卡提克·斯里尼瓦萨·穆尔西 , Yanqi Zhou公司 , 克里斯托夫·安格穆勒 , 迈克·伯罗斯 , 苏迪普·罗伊 , 凯坦·曼克 , 雷萨·法拉哈尼 , 于艾玛·王 , Berkin Ilbeyi公司 , 布莱克·赫奇曼 , 比亚克·鲁恩 , 沈旺(Shen Wang) , 徐元忠 , 塞缪尔·考夫曼 :
一种灵活的自动调整多通道机器学习编译器的方法。 1-16 亚历山大·布拉克曼 , 安德烈斯·戈恩斯 , 杰罗尼莫·卡斯特里隆 :
PolyGym:作为强化学习环境的多面体优化。 17-29 吉恩瓦·郑(Geonhwa Jeong) , Gokcen Kestor公司 , 普拉桑特·查塔拉西 , Angshuman Parashar公司 , 蔡波安(Po-An Tsai) , 西瓦桑卡兰·拉贾马尼卡姆 , 罗伯托·乔奥萨 , 图沙·克里希纳 :
联盟:MLIR中用于评估空间加速器张量操作的统一HW-SW协同设计生态系统。 30-44 威廉·S·摩西 , 洛伦佐·切里尼 , 赵瑞哲 , 奥列克桑德·齐恩科 :
多面体:将C提升为多面体MLIR。 45-59 布鲁斯·科利 , 迈克尔·F·P·奥博伊尔 :
使用灰盒行为进行程序提升。 60-74 金俊雄(Joonsung Kim) , Suyeon Hur公司 , Eunbok Lee公司 , Seungho Lee先生 , 金章武(Jangwoo Kim) :
NLP-Fast:一个快速、可扩展和灵活的系统,用于加速大规模异构NLP模型。 75-89 韩明云 , Woongki Baek公司 :
HERTI:一个增强学习增强系统,用于在异构嵌入式系统上进行有效的实时推理。 90-102 纳文·维杜拉 , 雷萨·霍贾布尔 , 艾哈迈德·孔萨里 , Arrvindh Shriraman公司 :
X层:为低秩卷积构建可组合的流水线数据流。 103-115 Daehyeon Baek公司 , 黄东进(Soojin Hwang) , Taekyung Heo公司 , Daehoon Kim公司 , Jaehyuk Huh先生 :
InnerSP:一种具有局部感知内积处理的内存高效稀疏矩阵乘法加速器。 116-128 马克西米利安·拉姆 , 扎卡里·叶迪迪亚 , 科尔比·R·班伯里 , 维杰·贾纳帕·雷迪 :
精确批处理:用于GPU上高效神经网络推理的位序列分解。 129-141 Wanling Gao公司 , 费唐 , 詹建峰 , 徐文 , 王磊(Lei Wang) , 郑操 , 川新兰 , 罗春杰 , 刘晓丽 , 姜紫涵 :
AIBench场景:场景识别AI基准测试。 142-158 阿米拉利·博鲁曼 , 索加塔Ghose , Berkin Akin公司 , 拉维·纳拉亚纳斯瓦米 , 杰拉尔多·奥利维拉 , 马晓宇 , 埃里克·肖 , Onur Mutlu公司 :
谷歌边缘设备神经网络模型:分析和缓解机器学习推理瓶颈。 159-172 刘国栋 , Sa Wang(萨旺) , 云冈包 :
SEER:一种基于GPU内核的CNN时间预测模型。 173-185 周敏轩 , 吴凌溪 , 李木洲 , 尼玛·莫希里 , 凯文·斯卡德隆 , 塔贾娜·罗辛 :
通过近内存计算超高效加速De Novo基因组组装。 199-212 纳迪娅·拉莫·霍尔特利德 , Madhavan Manivannan公司 , 佩尔·斯坦斯特罗姆 , Miquel Pericàs公司 :
CBP:缓存分区、带宽分区和预取节流的协调管理。 213-225 朱明灿 , 阿姆纳·沙哈卜 , 安东尼奥斯·卡萨拉基斯 , 鲍里斯·格罗 :
无效或更新? 重新审视未来缓存层次结构的一致性。 226-241 苏亚什·马哈尔 , 刘思航(Sihang Liu) , Korakit Seemakhupt公司 , 文森·杨 , 萨米拉·马纳比·汗 :
持久内存系统的写入预测。 242-257 阿卡什熊猫 , 阿什什·潘瓦尔 , 阿尔卡普拉瓦·巴苏 :
nuKSM:多插槽服务器上支持NUMA的内存去重。 258-273 尚晓伟 , 贾伟伟 , 尖城山 , 丁晓宁 :
CoPlace:有效缓解现代云中的缓存冲突。 274-288 丹尼尔·马惠特 , 萨姆·雷纳 , 魏翰 , 诺亚·菲尔兹 , Miles Claver系列 , 康纳·霍姆斯 , 杰迪迪亚·麦克卢格 , 刘同平(音) , 吴波 :
Dryadic:灵活快速的大规模图形模式匹配。 289-303 王鹏宇 , 李超(音) , 王静(音译) , 王陶雷 , 陆章 , 镜文冷 , 全晨 , 郭敏义 :
天行者:基于Alias方法的高效图形采样和GPU上的随机行走。 304-317 创艺桂 , 廖晓飞 , 龙正 , 彭城瑶 , 王庆刚 , 海金 :
SumPA:使用模式抽象的高效模式中心图挖掘。 318-330 Octavi Obiols销售 , 阿比纳夫·维希努 , 尼古拉斯·马来亚 , 阿帕尔娜·钱德拉莫利什瓦兰 :
SURFNet:使用小数据集进行传输学习的湍流超分辨率。 331-344 苏丹杜拉尼 , 穆罕默德·萨阿德·丘特艾 , 默特·希达耶托鲁 , 拉希德·塔希尔 , 阿卜杜勒·达克 , 劳伦斯·劳什沃格 , 法里德·扎法尔 , 文美·W·Hwu :
使用张量核和扭曲乱序加速傅里叶变换和数论变换。 345-355