ACM架构与代码优化汇刊,第19卷
第19卷第1期,2022年3月
阿迪蒂亚·乌卡兰德 , 苏里亚坎特·帕蒂达尔 , 拉姆·兰根 :
游戏应用程序的本地感知CTA调度。 1:1-1:26 刘洪志 , 杰罗 , 李颖 , 中海武 :
基于度量学习和协同过滤的迭代编译优化。 2:1-2:25 穆罕默德·阿迪蒂亚·萨松科 , 米林·查比 , 曼达纳·巴盖里·马尔齐亚拉尼(Mandana Bagheri-Marzijarani) , Didem Unat公司 :
ReuseTracker:快速而准确的多核重用距离分析器。 3:1-3:25 傅耀胜 , Evgeny牛肝素 , 尼拉德里什·查特吉 , 大卫·W·内兰(David W.Nellans) , 斯蒂芬·凯克勒 :
通过可组合的On-Package体系结构实现GPU域专业化。 4:1-4:23 Daeyal Lee公司 , 比尔·林 , 中宽诚 :
基于SMT的二维/三维混合维顺序路由SMART NoC无冲突任务映射与调度。 5:1-5:21 普拉桑特·查塔拉西 , 关孝君 , Angshuman Parashar公司 , 迈克尔·佩劳尔 , 图沙·克里希纳 , 维维克·萨卡尔 :
漫威:一种以数据为中心的方法,用于在空间加速器上绘制深度学习操作符。 6:1-6:26 丹尼斯·里伯 , 阿克塞尔·阿科斯塔 , 霍尔格·弗罗宁 :
基于约束编程的联合程序和布局转换,在专用硬件上启用卷积运算符。 7:1-7:26 蒙亚雷 , 范丽 , 王芳(Fang Wang) , 丹凤 , 邹晓敏 , 肖仁智 :
SecNVM:一种用于安全NVM的高效且写友好的元数据崩溃一致性方案。 8:1-8:26 Bang Di公司 , 胡道坤 , 甄燮 , 孙建华 , 郝晨 , 金奎仁 , 董丽(Dong Li) :
TLB飞行员:使用微架构软件调度缓解GPU上的TLB争用攻击。 9:1-9:23 古鲁拉吉·塞利什瓦尔 , 瑞克·博伊维 , 童晨 , 本杰明·西格尔 , Alper Buyuktosunoglu公司 :
HeapCheck:内存安全的低成本硬件支持。 10:1-10:24 穆罕默德·瓦哈尔·阿扎尔 , Miquel Pericás公司 , 佩尔·斯坦斯特罗姆 :
Task-RM:一个资源管理器,用于在服务质量约束下减少任务并行应用程序中的能耗。 11:1-11:26 塞萨尔·戈麦斯 , 马齐亚尔·阿米拉斯基 , 马可·亨普斯特德 :
CASHT:盗窃共享层级中的冲突分析。 12:1-12:27 王玉菲 , 董晓蛇 , 王龙翔 , 陈伟多 , 张兴军 :
基于LSTM-GAN模型的小样本磁盘故障检测优化。 13:1至13:24 弗兰耶尔·西尔法 , 何塞-玛丽亚·阿尔诺 , 安东尼奥·冈萨雷斯 :
E-BATCH:节能、高通量RNN配料。 14:1-14:23 陈丁 , 董晨 , 刘方舟 , 本杰明·雷贝尔 , 韦斯利·史密斯 :
CARL:编译器分配的引用租赁。 15:1-15:28
第19卷第2期,2022年6月
克里斯托夫·施拉克 , Tzung-Han Juang先生 , 克里斯托夫·杜巴赫 :
用于加速器高级合成的记忆软件功能IR。 16:1-16:26 卡提克·拉克希米纳拉西姆汗(Kartik Lakshminarasimhan) , 阿杰亚·奈塔尼 , 约苏·费利乌(JosuéFeliu) , Lieven Eeckhout公司 :
前向切片核心:高性能、低复杂度的微体系结构。 17:1-17:25 沙兰扬·斯里坎坦 , 沙亚克·查克拉博蒂 , 普林斯顿费罗 , 沙地亚Dwarkadas :
MAPPER:通过并行效率管理管理应用程序性能*。 18:1-18:26 阿萨纳西奥斯·齐奥瓦拉斯 , 乔治·迪米特里奥 , 乔治奥斯·斯塔穆利斯(Georgios I.Stamoulis) :
低功耗近数据指令执行利用基于操作码的时序分析。 19:1-19:26 兴国佳 , 金章(Jin Zhang) , 博世于 , 钱兴岳 , 郑维琪 , 海冰关 :
GiantVM:一种用于DSM-软件优化的资源聚合的新型分布式虚拟机监控程序。 20:1-20:27 梅赫扎德·内贾特 , Madhavan Manivannan公司 , Miquel Pericás公司 , 佩尔·斯坦斯特罗姆 :
协作松弛管理:通过在QoS约束的应用程序之间交换性能松弛来节省多核处理器的能量。 21:1-21:27 雨果·蓬波格纳克(Hugo Pompougnac) , 尤利塞·博格农 , 阿尔伯特·柯恩 , 杜米特鲁·波托普·布图卡鲁 :
将同步反应编织到SSA形式编译器的结构中。 22:1-22:25 加桑·肖巴吉 , 沃尔·斯科特·戈登 , 保罗·麦克休 , 西奥多·杜波伊斯 , 奥斯汀角 :
使用蚁群优化的寄存器压力软件指令调度。 23:1-23:23 王启翰(Qihan Wang) , 甄鹏 , 宾仁 , 陈杰(音译) , 罗伯特·G·爱德华兹 :
MemHC:用于加速多体关联的优化GPU内存管理框架。 24:1-24:26 拉凯什·库马尔 , Mehdi Alipour公司 , 大卫·布莱克·夏弗 :
依赖感知切片执行,以提高按顺序切片核心中的MLP。 25:1-25:28 南迪塔·维杰库马尔 , 阿塔伯克·奥尔根 , 康斯坦蒂诺斯·卡内洛普洛斯 , F.尼萨·博斯坦奇 , 哈桑哈桑 , 梅赫沙德·洛菲 , 菲利普·B·吉本斯 , Onur Mutlu公司 :
MetaSys:一个实用的开源元数据管理系统,用于实现和评估跨层优化。 26:1-26:29 陈静(音译) , Madhavan Manivannan公司 , 穆斯塔法·阿卜杜勒贾巴尔 , Miquel Pericás公司 :
ERASE:针对工作偷窃运行时的能效任务映射和资源管理。 27:1-27:29 叶晨成 , 徐元超 , 沈喜鹏 , 海金 , 廖晓飞 , 严索里欣 :
在非易失性存储器上进行GC-触发数据移动时保持可寻址性。 28分28秒26 乔治·米歇洛吉安纳基斯 , 本杰明·克伦克 , 布兰登·库克 , Min Yee Teh女士 , 马德琳·格利克 , 拉里·丹尼森 , 凯伦·伯格曼 , 约翰·沙尔夫 :
HPC中的组内资源分解案例。 29:1-29:26
第19卷第3期,2022年9月
王平(Ping Wang) , 费文 , 保罗·V·格拉茨 , 亚历克斯·斯普林特森 :
SIMD-Matcher:一种基于SIMD的任意匹配框架。 30:1-30:20 马塞尔·梅特勒 , 马丁·拉普 , 赫巴·科德尔 , 丹尼尔·米勒-格里奇内德 , 约格·汉克尔 , 乌尔夫·施利特曼 :
基于FPGA的多核处理器热资源管理策略评估方法。 31:1-31:24 帕沙利斯·姆佩斯 , 帕夫洛斯·佩托梅诺斯 , 金·哈泽尔伍德 , 休皮革 :
在交互式应用程序上捕获对象交集,以推动基于众包重播的编译器优化。 32:1-32:25 村路李 , 德尊侗族 , 廖祥科 :
MUA路由器:最大限度地提高片上流水线路由器的分配效用。 33:1-33:23 齐奥·乔杜里 , 沙什瓦特·什里瓦斯塔瓦 , 拉瓦尼亚·拉马潘图卢 , 苏雷什·普里尼 :
具有细粒度灵活并行性的CNN推理FPGA覆盖。 34:1-34:26 迪克莎·穆尔昌达尼 , 安舒尔·库马尔 , 斯姆鲁蒂·R·萨兰吉 :
GPU上并发执行的性能和功率预测。 35:1-35:27 阿里·贾汉沙希 , 俞南鹏 , 糖城市议员黄安祥 :
PowerMorph:QoS-Aware服务器电源重塑数据中心监管服务。 36:1-36:27 彭旭 , 赵南男(Nannan Zhao) , 鸡光丸 , 刘伟(音译) , 陈顺宁 , 周元辉 , 哈迪尔·阿尔巴哈 , 刘汉阳 , 刘唐 , 知湖滩 :
通过将本地存储与云存储集成,构建快速高效的LSM-tree存储。 37:1-37:26 黄宏瑞 , 丁永红 , 吴建中(Jan-Jan Wu) , 龚福珍 , 刘邦峰 , 许维中 :
加速异构系统架构上的视频字幕。 38:1-38:25 希瓦姆·昆丹 , 西奥多罗斯·马里纳基斯 , 伊拉克利斯·阿纳格诺斯托普洛斯 , 迪米特里·卡加里斯 :
多核系统上冲突最小化的压力感知策略。 40:1-40:26 乔纳森·阿尔索普 , Weon Taek Na公司 , 马修·辛克莱 , 塞缪尔·格雷森 , 莎莉塔V.Adve :
异质系统中细粒度一致性专业化的案例。 41:1-41:26 穆罕默德·索尔塔尼耶 , 理查德·马丁 , Santosh Nagarakatte公司 :
利用收缩通用矩阵乘法的稀疏卷积神经网络加速器。 42:1-42:26 Dharanidhar Dang公司 , 比尔·林 , 德巴希斯·萨胡 :
LiteCON公司 :高效节能深度学习的全光子神经形态加速器。 43:1-43:22 洛克什·西德胡 , 拉杰什·凯迪亚 , 谢尔贾·潘迪 , 马丁·拉普 , Anuj Pathania公司 , 约格·汉克尔 , Preeti Ranjan熊猫 :
CoMeT:用于2D、2.5D和3D处理器-内存系统的集成区间热模拟工具链。 44:1-44:25 马修·本杰明·奥尔森 , 布兰登·卡梅迪纳 , 迈克尔·詹茨 , Kshitij A.Doshi公司 , 特里·琼斯 :
异构内存系统的在线应用指南。 45:1-45:27 布鲁诺·奇内拉托·奥诺里奥 , 乔·佩尔·德·卡瓦略 , 卡塔琳娜·穆尼奥斯·莫拉莱斯 , 亚历山大·巴尔达辛 , 吉多·阿劳霍 :
使用障碍省略改进事务代码生成。 46:1-46:23
第19卷第4期,2022年12月
李建松 , 王雪英 , 陈晓兵 , 李广利 , 肖东 , 彭昭 , Xianzhi余 , 杨永新 , 魏曹 , 刘雷(Lei Liu) , 冯小兵 :
DNN加速器的应用程序级内存调度系统。 47:1-47:26 阿迪蒂亚·纳拉扬 , 伊万·通纳特 , 帕斯卡·维韦 , Ayse K.Coskun公司 , 阿贾·伊乔希 :
构建光控相变存储器。 48:1-48:26 张超(Chao Zhang) , 马克西米利安·布雷默 , Cy P.Chan先生 , 约翰·沙尔夫 , 郭晓晨 :
ASA:加速柱状SpGEMM中的稀疏积累。 49:1-49:24 Aart J.C.自行车 , Penporn Koanantakool公司 , 塔蒂亚娜·施佩斯曼 , 尼古拉·瓦西拉切 , 郑碧霞 , 弗雷德里克·克约尔斯塔德 :
MLIR中稀疏张量计算的编译器支持。 50:1-50:25 皮埃尔·米绍德 , 茴香 :
HAIR:使用奇数/偶数银行将整数寄存器文件的面积减半。 51:1-51:25 阿米雷扎·尤塞夫扎德 , 简·斯图伊特 , Martijn Hijdra公司 , 刘晓慧 , Anteneh Gebregiorgis公司 , 阿布海拉杰·辛格 , 哈姆迪奥伊说 , 弗兰基·卡特(Francy Catthoor) :
节能内存地址计算。 52:1-52:16 Hwisoo那么 , 穆斯林Didehban , Yohan Ko公司 , 阿维拉尔·施瓦斯塔瓦 , Kyongwoo Lee(李京宇) :
专长:针对硬件故障的有效软件级冗余多线程方案。 53:1-53:26 蒂姆·哈特雷 , Foivos S.Zakkak公司 , 安迪·尼斯贝特 , 克里斯托斯·科采利迪斯 , 米凯尔·卢扬 :
ARM上的实时编译-更详细地了解调用站点代码的一致性。 54:1-54:23 二岭雷尼莫果冻 , 米利卡·奥兰迪奇 , 埃德蒙·布雷克 , 托·阿恩·约翰森 , 托雷夫·布莱恩 :
FPGA上稀疏分配问题的求解。 55:1-55:20 李玉豪 , 本杰明·C·李 :
Phronesis:用于高维配置调整的高效性能建模。 56:1-56:26 Chandrahas Tirumalasetty公司 , Chih-Chieh Chou先生 , A.L.纳拉西姆哈·雷迪 , 保罗·格拉茨 , 艾曼·阿布埃尔法法 :
通过增强的Page Walker减少次要页面错误开销。 57:1-57:26 兰高 , 王静(音译) , 张伟功 :
商品GPU上细粒度同步的自适应争用管理。 58:1-58:21 韩若兵 , Jaewon Lee先生 , Jaewoong Sim先生 , 金贤森 :
COX:向CPU公开CUDA翘曲级功能。 59:1-59:25 刘一丁 , 张兴耀 , 东林庄 , 辛福 , 宋帅文 :
DynamicAP:在自动处理器上对动态图形遍历的体系结构支持。 60:1-60:26 邹昌伟 , 姚庆高 , 薛静玲 :
x86-64上实用的基于软件的阴影堆栈。 61:1-61:26