ASPLOS 2024: 拉荷亚,加利福尼亚州,美国
拉吉夫·古普塔 , Nael B.Abu-Ghazaleh公司 , 穆苏瓦蒂夫人 , 丹·萨弗里尔 :
2024年4月27日至2024年5月1日,美国加利福尼亚州拉霍亚市,第29届ACM编程语言和操作系统架构支持国际会议记录,第2卷,ASPLOS 2024。 ACM公司 2024 金俊培(Junpyo Kim) , Min东月 , 赵正民(Jungmin Cho) , Hyeonseong Jeong先生 , 伊尔昆·拜恩 , Choi君赫 , 朱元红(Juwon Hong) , 金章武(Jangwoo Kim) :
一种容错的百万比特分布式量子计算机。 1-19 迈克尔·戴维斯 , 伊恩·麦克道格尔 , Selvaraj Anandaraj公司 , Deep Machchar公司 , Rithik Jain公司 , Karthikeyan Sankarlingam公司 :
1000个内核的旅程始于一步:GPU上深度学习的回顾。 20至36 瑞斯·库珀 , Ipoom Jeong公司 , 袁一凡 , 王仁(音) , 纳拉扬·兰加纳坦 , 尼基尔·拉奥 , 胡嘉玉 , 桑杰·库马尔 , 菲利普·兰茨 , 南宋金 :
现代Intel Xeon可扩展处理器中数据流加速器的定量分析与指南。 37-54 叶敏(音) , 乔莉 , 伊娜·吕 , 张杰(音译) , 天宇人 , 丹尼尔·文 , 崔伟国(Tei-Wei Kuo) , 薛俊杰(Chun Jason Xue) :
实现3D NAND闪存的近零读取重试。 55-70 魏义勋 , 李炳哲 , 大卫·H·C·杜 :
一种通过减少引物-有效载荷碰撞来扩大实际DNA存储容量的编码方案。 71-84 阿尔贝托·德尔马斯·拉斯科茨 , 穆斯塔法·马哈茂德 , 阿里·哈迪·扎德 , 米洛斯·尼科利奇 , 卡里姆·易卜拉欣 , 克里斯蒂娜·吉安诺拉 , 阿梅尔·阿卜杜勒哈迪 , 安德烈亚斯·莫绍沃斯 :
亚特兰大:一个比特值一个“千”张量值。 85-102 Jaehyun公园 , Jaewan Choi先生 , 关节庆 , 迈克尔·杰明·金 , Yongsuk Kwon先生 , 南宋金 , 郑浩安 :
收件人! 为基于成批变换的生成模型推理释放PIM的威力。 103-119 迈克尔·弗兰德斯 , Reshabh K.Sharma公司 , 亚历山德拉·E·迈克尔 , 丹·格罗斯曼 , 大卫·科尔布伦纳 :
通过二进制代码转换避免以教学为中心的微体系结构计时通道。 120-136 尼古拉·萨马尔季奇 , 丹尼尔·桑切斯 :
BitPacker:在完全同态加密加速器中实现高算法效率。 137-150 《紫苑文》 , 凌坤·孔 , 亚历克西斯·勒·格劳内克 , 康斯坦丁诺斯·马莫拉斯 , 杨开元 :
BVAP:有界重复正则表达式的能量和内存高效自动机处理。 151-166 潘哲文 , 约书亚·圣米格尔 , 狄武 :
克拉:解锁无乘法器GEMM的价值级并行性。 167-184 松云区 , 赵世新 , 李兵 , 何银涛 , 徐毅才 , 张磊(Lei Zhang) , 王颖(音) :
CIM-MLC:用于内存加速计算的多级编译堆栈。 185-200 卓然歌 , 春雨琪 , 刘芳欣 , Naifeng Jing公司 , 梁晓尧 :
CMC:通过CODEC辅助矩阵压缩加速视频变压器。 201-215 林福慧(Sophia Fuhui Lin) , 约书亚·维兹莱 , 凯特琳·N·史密斯 , Gokul Subramanian拉维 , 查尔斯·袁 , 弗雷德里克·T·冲 , 本杰明·布朗 :
存在缺陷时量子纠错码和模块化小芯片的代码设计。 216-231 Yian Su(音译) , 迈克·雷尼 , 尼克·万宁格 , 纳德哈姆·迪安特拉万 , 梁晓丰 , Umut A.Acar公司 , 彼得·丁达 , 西蒙·坎帕诺尼 :
为不规则工作负载编译基于循环的嵌套并行性。 232-250 纳撒尼尔·韦斯利·费拉多 , 布雷特·古斯坦 , 乔纳森·伍德拉夫 , 杰西卡·克拉克 , 彼得·鲁格 , 布鲁克斯·戴维斯 , 庄士敦 , 罗伯特·M·诺顿 , 大卫·奇斯纳尔 , 西蒙·摩尔 , 彼得·G·诺依曼 , 罗伯特·N·M·沃森 :
聚宝盆重新装载:CHERI堆临时安全的装载障碍。 251-268 王育能 , 格伦·科恩 , 乌尔里希·吕尔迈尔 , 萨拉·阿科尔 :
用Ark设计新型模拟计算范式。 269-286 张济源 , 贾伟伟 , 思源柴 , 刘佩哲 , Jongyul Kim先生 , 徐天音 :
虚拟云的直接内存转换。 287-304 罗志宏 , Sam Son公司 , 德夫·巴厘 , 艾曼纽尔·阿马罗 , 艾米·奥斯特霍特 , 西尔维娅·拉纳萨米 , 教授斯科特·申克 :
具有微小量子数的高效微秒级盲调度。 305-319 余洪文 , 赵晓刚 , 游周 , 张彤(音译) , 杨尚军 , 谢长生 , 费武(Fei Wu) :
通过硬件/软件协同设计消除SSD阵列重复数据消除的存储管理开销。 320-335 Sashwat Anagolum公司 , 纳吉斯·阿拉维萨马尼 , 普拉米·达斯 , 莫努丁·库雷希 , Yunong Shi公司 :
Elivagar:有效的量子电路分类搜索。 336至353 里斯·格雷奇 , 北洋宋 , Advait Madhavan公司 , 杰里米·刘 , 蒂莫西·舍伍德 :
具有时间算法的节能卷积。 354-368 吴贤俊 , Kihong Kim(基洪·金) , 金正恩(Jaemin Kim) , Sungkyun Kim先生 , 李俊英 , 杜松昌 , Jiwon Seo先生 :
ExeGPT:LLM推理的约束感知资源调度。 369-384 刘玉石 , 孙萱萱 , 李子君 , 全晨 , Sen Gao先生 , 何炳生 , 李超(音) , 郭敏义 :
FaaSGraph:通过无服务器计算实现可扩展、高效和经济高效的图形处理。 385-400 Lieven Eeckhout公司 :
焦点:评估处理器可持续性的一阶碳模型。 401-415 古斯·亨利·史密斯 , 本杰明·库什吉安 , 维沙尔·卡努马拉 , 张崇基 , 史蒂文·柳波米尔斯基 , Sorawee Porncharoenwase公司 , 雷内只是 , 吉尔伯特·路易斯·伯恩斯坦 , 扎卡里·塔特洛克 :
使用草图引导程序合成的FPGA技术映射。 416-432 郝玲 , 黄鹤庆 , 王承鹏 , 蔡元岛 , 查尔斯·张 :
GIANTSAN:使用段折叠的高效内存清理。 433-449 聪国 , Rui Zhang(张瑞) , 徐嘉乐 , 镜文冷 , 刘子汉 , 黄子玉 , 郭敏义 , 郝武 , 赵守仁 , 赵俊平 , 张科 :
GMLake:高效透明的GPU内存碎片整理,用于虚拟内存缝合的大规模DNN训练。 450-466 孙玉阳 , Cale英格兰 , 李毅 , 李炳哲 , 杨明昌 :
格拉芙:释放出核外同步图形处理未来价值计算的全部潜力。 467-481 迪伦·沃尔夫 , 郑实 , 格雷戈里·J·鸭子 , 乌芒·马图尔 , 阿比克·罗伊乔杜里 :
并发测试的灰盒模糊。 482-498 紫照墨 , 许欢乐 , 徐成忠 :
Heet:加快异构深度学习集群中的弹性训练。 499-513 阿卡什·科塔里 , 阿卜杜勒·拉斐·努尔 , 徐慕晨 , 哈萨姆·乌丁 , 德鲁夫·巴洛尼亚 , 斯特凡诺斯·巴齐奥蒂斯 , 维克拉姆·S·阿德 , 查里斯·门迪斯 , 苏迪普塔·森古普塔 :
Hydride:一种适用于现代硬件体系结构的基于可重定目标和可扩展综合的编译器。 514-529 罗汉·马哈帕特拉 , Soroush Ghodrati公司 , Byung Hoon Ahn先生 , 肖恩·金泽 , 王树亭 , 徐汉阳 , 拉瓦尼亚·卡尔蒂基扬 , 哈迪克·夏尔马 , 阿米尔·亚兹丹巴赫(Amir Yazdanbakhsh) , 穆罕默德·阿利安 , 哈迪·伊斯梅尔扎德 :
针对无服务器计算的存储域特定加速。 530-548 刘子涵 , 倪文涛 , 镜文冷 , 于峰 , 聪国 , 全晨 , 李超(音) , 郭敏义 , 朱玉豪 :
JUNO:使用稀疏感知算法和光线跟踪核心映射优化高维近似最近邻搜索。 549-565 Hochan Lee公司 , 罗珊·达塔赫里 , Keshav Pingali语 :
Kimbap:用于分布式图形分析的节点属性映射系统。 566-581 赵子瑞Neil Zhao , 亚当-莫里森 , 克里斯托弗·弗莱彻 , 约塞普·托雷拉斯 :
最后一级缓存侧通道攻击在现代公共云中是可行的。 582-600 张元义 , 张恒(Heng Zhang) , 曹文斌 , 兴和 , 大军公园 , 崔金英(Jinyoung Choi) , 宋骏公园 :
LazyBarrier:重建Android IO堆栈以支持屏障的闪存。 601-615 林俊泰 , Youngeun Kwon公司 , Ranggi Hwang公司 , Kiwan Maeng先生 , G.爱德华·苏 , 明秀·鲁 :
LazyDP:用于不同私有推荐模型可扩展训练的协同设计算法软件。 616-630 Adwait Godbole公司 , Kevin Cheang(凯文·张) , 亚丁·A·马内卡 , 桑吉特·塞希亚 :
从RTL中提升微观更新模型以进行正式安全分析。 631-648 扎卡里·叶迪迪亚 :
轻量级故障隔离:实用、高效和安全的软件沙盒。 649-665 尤金·沙 , 刘德华(Andy Liu) , 卡里姆·易卜拉欣 , 穆斯塔法·马哈茂德 , 克里斯蒂娜·吉安诺拉 , 阿梅尔·阿卜杜勒哈迪 , 安德烈亚斯·莫绍沃斯 :
Marple:用于无约束大脑-机器接口的可扩展峰值排序。 666-682 洪武鹏 , 西席(Xi Xie) , 考斯图布·什维迪卡尔 , 阿米特·哈桑(Amit Hasan)先生 , 赵家辉 , 黄绍仪 , 奥马尔·汗 , 大卫·R·凯利 , 丁彩文 :
MaxK-GNN:用于加速图形神经网络训练的极快GPU内核设计。 683-698 张荷子 , 可依·殷 , 吴安邦 , 哈桑·沙普里安 , 阿里雷扎·沙巴尼 , 丁宇飞 :
机械师:超导量子芯片的多入口通信高速公路。 699-714 阿纳加·莫拉卡穆尔·阿尼尔·库马尔(Anagha Molakalmur Anil Kumar) , 阿迪蒂亚·普拉桑纳 , 乔纳森·巴尔金德 , Arrvindh Shriraman公司 :
METAL:在特定于域的体系结构中缓存多级索引。 715-729 Nuntipat Narkthong公司 , 段世进 , 任少雷 , 徐晓林 :
MicroVSA:一个基于超轻矢量符号体系结构的分类器库,用于微小微控制器上的Always-On推断。 730-745 滋肾丸 , 南迪尼·钱德拉穆尔蒂 , 卡提克·斯瓦米纳坦 , 陈品玉(Pin-Yu Chen) , Kshitij Bhardwaj公司 , 维贾伊·贾纳帕·雷迪 , 阿里吉特·雷乔杜里 :
MulBERRY:为节能多智能体自治系统实现位错误鲁棒性。 746-762 加居白 , 宋浩轩 , 胡世民 :
机器人操作系统中机器人程序的多维和消息引导模糊。 763-778 陈建新 , 丁大伟 , 威远宫 , 黄铜进 , 齐烨 :
统领一切的一门方案:为量子计算引入一个复杂但精简的指令集。 779-796 冯宇 , 李广利 , 赵嘉诚 , 崔惠民 , 冯小兵 , 薛晶凌 :
通过快速微核聚合优化加速器上的动态形状神经网络。 797-812 郝玉辉 , 甘一鸣 , 薄玉 , 刘强(音) , 银河韩 , 滋肾丸 , 刘绍山 :
ORIANNA:基于优化的机器人应用的加速器生成框架。 813-829 黄洪明 , 王鹏(音译) , 强素(Qiang Su) , 洪旭 , 薛俊杰(Chun Jason Xue) , 安德烈·布林克曼 :
Palantir:用于重复数据消除后增量压缩的分层相似性检测。 830-845 巴尔加夫·雷迪·戈达拉 , 桑卡拉·普拉萨德·拉梅什 , 吉尔斯·波卡姆 , 贾里德·斯塔克 , 安德烈·塞兹内克 , 院长M.Tullsen , 戴维·奥古斯特 :
PDIP:优先级定向指令预取。 846-861 科林·德雷维斯 , 奥利维娅·翁 , 安德烈斯·梅扎 , 阿尔里克·阿尔霍夫 , 大卫·科尔布伦纳 , 瑞恩·卡斯特纳 , 达斯汀·里士满 :
Pentimento:云FPGA中的数据剩余。 862-878 丛莉 , 浙江 , 杨旺(Yang Wang) , 范扬 , 曹婷(Ting Cao) , 毛洋 , 云亮(Yun Liang) , 孙光裕 :
PIM-DL:通过算法-系统协同优化扩展商品DRAM-PIM对深度学习的适用性。 879-896 安德烈·洛佩斯 , 丹尼尔·卡斯特罗 , 保罗·罗曼诺 :
PIM-STM:用于处理内存系统的软件事务内存。 897-911 周安顺康 , 叶成峰 , 黄鹤庆 , 蔡元岛 , 查尔斯·张 :
浮游生物:协调二进制代码和调试信息。 912-928 杰森·安塞尔 , 爱德华·Z·杨 , 贺瑞斯(Horace He) , 纳塔莉亚·吉梅尔谢恩 , 阿尼梅斯·贾恩 , 迈克尔·沃兹内森斯基 , Bin Bao公司 , 彼得·贝尔 , 大卫·贝拉德 , 叶夫根尼·布洛夫斯基 , 吉塔·乔汉 , 安贾利·乔尔迪亚 , 威尔·康斯特布尔 , 阿尔班·德斯梅森 , 扎卡里·德维托 , 埃利亚斯·埃利森 , 威尔·冯 , Jiong龚 , 迈克尔·格什温 , 布莱恩·赫什 , 黄夏洛克 , Kshiteej Kalambarkar公司 , 劳伦特·基尔希 , 迈克尔·拉佐斯 , 马里奥·莱兹卡诺 , 梁燕波 , 贾森·梁(Jason Liang) , 英海路 , C.K.Luk(陆克文) , 伯特·马赫 , 潘云杰 , 克里斯蒂安·普尔施 , 马提亚斯·雷索 , 马克·萨鲁菲姆 , 马科斯·尤基奥·西莱奇 , 海伦·苏克 , 张顺廷 , 迈克尔·索 , 菲尔·蒂莱特 , 徐昭 , 王爱坎(Eikan Wang) , 周克仁 , 理查德·邹 , 王晓东 , 阿吉特·马修斯 , 威廉·温 , 格雷戈里·查南 , 吴鹏(音) , Soumith Chintala公司 :
PyTorch 2:通过动态Python字节码转换和图形编译加快机器学习。 929-947 四味坛 , 陆立强 , 张汉玉(Hanyu Zhang) , 贾宇 , 从良郎 , 永亨商 , 赵新奎 , 陈明帅 , 云亮(Yun Liang) , 尹建伟 :
QuFEM:使用有限元方法进行快速准确的量子读数校准。 948-963 郑旺(音) , 王育科 , 贾其登 , 大正 , 李安(Ang Li) , 丁宇飞 :
RAP:用于多GPU推荐模型训练和输入预处理的资源软件自动GPU共享。 964-979 孟旺(Meng Wang) , 薄芳 , 李安(Ang Li) , 普拉珊·奈尔 :
Red-QAOA:通过电路简化实现高效的变量优化。 980-998 张宇轩 , 内森·索博特卡 , Soyoon公园 , 萨巴·贾米兰 , 坦维尔·艾哈迈德·汗 , 巴里斯·卡西奇 , 吉尔斯·波卡姆 , 海纳·利茨 , 约瑟夫·迪瓦蒂 :
角色扮演游戏 2 :健壮的配置文件引导的运行时预取生成。 999-1013 阿尼什·萨克塞纳 , 索拉夫·马图尔 , 莫努丁·库雷希 :
Rubix:通过随机行到行映射减少安全行锤缓解的开销。 1014-1028 程建义 , 塞缪尔·科沃德 , 洛伦佐·切里尼 , 拉斐尔·巴巴略 , 西奥·德雷恩 :
SEER:使用电子图重写进行高级综合的超级优化浏览器。 1029-1044 本杰明·福尔摩斯 , 杰森·沃特曼 , 丹·威廉姆斯 :
SEVeriFast:最大限度地减少SEV微虚拟机快速启动的信任根。 1045-1060 二虎峰 , 大虎峰 , 董都 , 夏玉斌 , 郑文斌 , 赵思奇 , 陈海波 :
sIOPMP:针对TEE的可扩展且高效的I/O保护。 1061-1076 沙申克·阿南德 , 迈克尔·弗里德曼 , 迈克尔·贾迪诺 , 古斯塔沃·阿隆索 :
跳过它:控制你的缓存! 1077-1094 陈洪政 , 科迪·郝宇 , 帅正 , Zhen Zhang先生 , 张志儒 , 王义达(Yida Wang) :
Slapo:大型深度学习模型训练的渐进优化调度语言。 1095-1111 苗旭鹏 , 楚南石 , 段江飞 , Xi小丽 , 林大华 , 崔斌(音) , 贾志浩 :
SpotServe:在可抢占实例上为生成性大型语言模型提供服务。 1112-1127 乔纳斯·贾芬格 , 斯蒂芬·加里宁 , 丹尼尔·格鲁斯 , 弗兰克·米勒 :
套装:带指令陷阱的安全Undervolting。 1128-1145 苏奇塔·帕蒂 , 沙泽恩·阿加 , 伊斯兰教 , 努万·贾亚塞纳 , 马修·辛克莱 :
T3:对计算和集合的细粒度重叠进行透明跟踪和触发。 1146-1164 Soroush Ghodrati公司 , 肖恩·金泽 , 徐汉阳 , 罗汉·马哈帕特拉 , 尹松金(Yoonsung Kim) , Byung Hoon Ahn先生 , 王东凯 , 拉瓦尼亚·卡尔蒂基扬 , 阿米尔·亚兹丹巴赫(Amir Yazdanbakhsh) , Jongse公园 , 南宋金 , 哈迪·伊斯梅尔扎德 :
串联处理器:与神经网络中新兴的算子相结合。 1165-1182 王玉凤 , 查里斯·门迪斯 :
TGLite:连续时间时序图神经网络的轻量级编程框架。 1183-1199 查尔斯·布洛克 , Gerasimos Gerogannis公司 , 查里斯·门迪斯 , 阿里夫·阿扎德 , 约塞普·托雷拉斯 :
双面:结合集体和单面通信,实现高效的分布式SpMM。 1200-1217 戴镇阳 , 刘爽(音译) , 维勒姆·舍伯格(Vilhelm Sjöberg) , 李旭鹏 , 于晨 , 王文浩 , 贾月凯 , 肖恩·诺布尔·安德森 , 莱拉·埃尔舍伊里 , Shubham Sondhi公司 , 于章 , 倪兆忠 , 寿梦岩 , 顾荣辉 , 郑裕和 :
验证软件Enclave虚拟机监控程序中页表的锈蚀实现。 1218年-1232年 洪亮区 , 于志斌 :
WASP:NUMA服务器的工作负载感知自复制页面表。 1233-1249年 费比安·帕泽福尔 , Chinmay Deshpande公司 , 费利西塔斯·赫泽特 , 主任弗朗兹 :
你追踪的是你得到的:二进制重新编译的动态堆栈布局恢复。 1250-1263