ASPLOS 2023:加拿大不列颠哥伦比亚省温哥华
托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 迈克尔·斯威夫特 :
2023年3月25日至29日,加拿大不列颠哥伦比亚省温哥华,第28届ACM编程语言和操作系统架构支持国际会议记录,第3卷,ASPLOS 2023。 ACM公司 2023 ,国际标准图书编号 978-1-4503-9918-0
主题演讲
论文
田博宇 , 陈启航(Qihang Chen) , 高明宇 :
ABNDP:近数据处理中数据访问和负载平衡的协同优化。 3-17 Toluwanii O.Odemuyiwa先生 , 哈迪·阿斯加里·莫加达姆 , 迈克尔·佩劳尔 , 卡提克·赫格德 , 蔡波安(Po-An Tsai) , 尼尔·克莱顿·克雷戈 , 阿默·贾勒尔 , 约翰·欧文斯 , 埃德加·索洛莫尼克 , 乔尔·埃默 , 克里斯托弗·弗莱彻 :
通过动态反射平铺加速稀疏数据协调。 18-32 杰克逊·梅尔切特 , 凯瑟琳·冯 , 卡勒布·多诺维克 , 罗斯·戴利 , 里特维克·夏尔马 , 克拉克·W·巴雷特 , 马克·霍洛维茨 , 帕特·汉拉罕 , 普里扬卡·雷纳 :
APEX:使用频繁子图分析的自动处理元素设计空间探索框架。 33-45 林成 , 马克斯·鲁滕贝格 , 戴雪荣 , 达斯汀·里士满 , 迈克尔·泰勒 , 马克·奥斯金 , 克里斯托弗·巴顿 :
超越静态并行循环:使用软件管理的暂存存储器在Manycore架构上支持动态任务并行性。 46-58 费华 , 金玉伟 , 陈彦浩 , 苏哈斯·维塔尔 , 凯文·克苏里奇 , 列夫·S·毕晓普 , 约翰·拉佩尔 , 阿里·贾瓦迪·阿巴哈里 , 埃迪Z.张 :
CaQR:一种通过动态电路进行量子比特重用的编译器辅助方法。 59-71 香玉高 , 迪维亚·拉胡纳桑 , 方瑞杰(Ruijie Fang) , 王涛(音译) , 朱晓桐 , 阿尼鲁德·西瓦拉曼 , 斯里尼瓦斯·纳拉亚纳 , 阿尔蒂·古普塔 :
CaT:包处理管道的求解辅助编译器。 72-88 卡提克·加里梅拉 , 扎赫拉·古德西 , 南丹·库马尔·贾 , Siddharth Garg公司 , 布兰登·里根 :
描述和优化用于私有推断的端到端系统。 89-104 田瑞伟 , 纳泽克·图塔耶娃 , 马塞洛·奥伦斯·维拉 , Omkar Lonkar公司 , 乔纳森·巴尔金德 :
队列:面向软件的异构SoC加速。 105至117 拉加夫·马利克 , 卡比尔·谢斯 , 米林·库尔卡尼 :
Coyote:用于矢量化加密算术电路的编译器。 118-133 爱德华·汉森 , 马克·霍顿 , 海(海伦)李 , 陈一然 :
DefT:提高GPU上可变形卷积操作的可扩展性。 134-146 《君毅书》 , 朱瑞东 , 马云(Yun Ma) , 黄刚 , 洪梅 , 刘轩哲 , 新晋 :
现代数据中心中的分解RAID存储。 147-163 毛琳 , 周克仁 , 苏鹏飞 :
DrGPUM:GPU加速应用程序的指导内存优化。 164-178 阿什维尼·雷纳 , 陆建安 , 阿萨夫·西登 , 迈克尔·弗里德曼 :
使用PrismDB实现存储层之间的高效压缩。 179-193 腾马 , 陈善培 , 吴一豪 , 邓二伟 , 卓松 , 全晨 , 郭敏义 :
模块化Linux内核的高效调度程序实时更新。 194-207 亚历山德罗·里维蒂 , 罗伯托·比富尔科 , 安吉洛·图卢梅洛 , 马可·博诺拉 , 萨尔瓦多-蓬塔雷利 :
eHDL:将eBPF/XDP程序转换为NIC的硬件设计。 208-223 靖国贤一 , Hajime Tazaki先生 , 皮埃尔·路易斯·奥布林 :
虚拟机的无出口、独立和共享访问。 224-237 李少华 , 苏振东 :
通过编译器驱动的差异测试发现不稳定的代码。 238-251 弗朗西斯科·穆尼奥斯·马丁内斯 , Raveesh Garg公司 , 迈克尔·佩劳尔 , 何塞·L·阿贝兰 , 曼纽尔·阿卡西奥 , 图沙·克里希纳 :
Flexagon:高效DNN处理的多数据流稀疏矩阵乘法加速器。 252-265 什拉文·纳拉扬 , 塔尔·加芬克尔 , 穆罕默德卡泽姆塔拉姆 , 乔伊·鲁迪克 , 丹尼尔·莫吉米 , 伊万·约翰逊 , 克里斯·法林 , Anjo Vahldiek奥伯瓦纳 , 迈克尔·勒梅 , 拉维·萨希塔 , 院长M.Tullsen , 戴安·斯特凡 :
超越SFI的限制:使用HFI实现灵活安全的硬件辅助进程内隔离。 266-281 叶浩杰 , 桑基斯·维杜拉 , Yuhan Chen(陈玉涵) , 杨一成 , 亚历克斯·M·布朗斯坦 , 罗纳德·德雷斯林斯基 , 特雷弗·穆奇 , 西希尔·塔拉蒂 :
GRACE:一种基于可缩放图形的方法,用于加速推荐模型推断。 282-301年 巴斯蒂安·哈格多恩 , 料仓风机 , 陈汉峰 , 克里斯·塞卡 , 迈克尔·加兰德 , 维诺德·格罗弗 :
石墨烯:用于GPU上优化张量计算的IR。 302-313 骏碧 , 齐国 , 李夏青 , 赵永伟 , 袁伯文 , 郭宇轩 , 恩施怀州 , 星虎 , 杜自东 , 凌莉 , 陈华平 , 陈天石 :
Heron:深度学习加速器的自动约束高性能库生成。 314-328 图沙·斯瓦米 , 阿努斯·祖尔菲卡尔 , 路易吉·纳尔迪 , 穆罕默德·沙巴兹 , 昆勒·奥卢科顿 :
Homunculus:为数据中心网络自动生成高效的数据平面ML管道。 329-342 胜利(Sheng Li) , 加勒特·安徒生 , 陈涛(Tao Chen) , 程立群 , 朱利安·格雷迪 , 大黄 , Quoc V.Le公司 , 黎安宙 , 辛莉(Xin Li) , 杨丽 , 陈亮 , 陆一峰 , 云妮 , 彭若明 , 名兴滩 , 马丁·威克 , 吴刚 , Shengqi Zhu先生 , 帕塔萨拉西·兰加纳坦 , 诺曼·乔比 :
超大规模硬件优化神经架构搜索。 343-358 王正荣 , 克里斯托弗·刘 , 阿曼·阿罗拉 , 莉西·库里安·约翰 , 托尼·诺瓦茨基 :
无限流:便携和程序员友好的内存/近内存融合。 359-375 刘硕 , 王巧玲 , Junyi Zhang(张君毅) , 吴文飞 , 林钦良 , 姚刘 , 孟旭 , 马可·卡尼尼 , 雷·C·张 , 何剑飞 :
分布式训练中具有传输透明性的网络内聚合。 376-391 布拉德利·丹比 , 克里希纳·钦塔拉普迪 , 兰维尔·钱德拉 , 布兰登·露西亚 , 沙迪·诺加比 :
柯丹:解决太空中的计算瓶颈。 392至403 张冲(Chong Zhang) , 李松凡 , 宋一航 , 《千和梦》 , 陈明华 , 白燕旭 , 李璐 , 朱洪子 :
乐高:为下一代物联网设备提供芯片级功能即插即用。 404-418 欧文锦 , 清辉星 , 李颖 , 水光灯 , 何水兵 , Gang Pan公司 :
将超大规模峰值神经元网络映射到神经形态硬件。 419-432 克里希南·戈萨坎 , 韩杰云 , 威廉·库兹摩尔 , 易卜拉欣·穆巴雷克 , 尼日哈尔·穆克吉 , 卡西克·斯里拉姆 , 吉多·塔利亚维尼 , 埃文·韦斯特 , 迈克尔·本德 , Abhishek Bhattacharjee公司 , 亚历克斯·康威 , 马丁·法拉赫-科尔顿 , 杰内尔·甘地 , 罗伯·约翰逊 , 苏达顺·坎南 , 唐纳德·E·波特 :
马赛克页面:大TLB达到与小页面。 433-448 塞缪尔·夏 , 乌迪特·古普塔 , 舱底Acun , 纽沙·阿尔达拉尼 , 潘忠 , 顾延伟 , 大卫·布鲁克斯 , 卡罗尔·让·吴 :
MP-Rec:软硬件协同设计,支持多路径推荐。 449-465 王树科 , 张明兴(Mingxing Zhang) , 柯扬 , 康晨 , 马绍南 , Jinlei Jiang(姜金磊) , 吴永伟 :
NosWalker:一种用于核外随机行走处理的解耦架构。 466-482 张忠成 , 严欧 , 刘莹(音) , 王晨曦 , 周永斌 , 王晓宇(音译) , 张玉阳 , 禹城欧阳 , 嘉豪山 , 王颖(音) , 薛晶凌 , 崔惠民 , 冯小兵 :
Occamy:跨多个CPU内核弹性共享SIMD协处理器。 483-497 超逸阮 , 张英强 , 赵碧 , 马晓松 , 郝晨 , 李菲菲 , 杨新军 , 程莉 , 阿什拉夫·阿博勒纳加 , 许银龙 :
云端关系数据库的持久内存分解。 498-512 蔡斯·诺曼 , Adwait Godbole公司 , 亚丁·A·马内卡 :
PipeSynth:用于内存一致性的微体系结构公理的自动合成。 513-527 克里斯托弗·杰列斯尼安斯基 , 莫汉娜德·伊斯梅尔 , Yeongjin Jang(杨金江) , 丹·威廉姆斯 , 昌宇敏 :
保护系统调用,用BASTION保护(大多数)世界。 528-541 穆罕默德·艾达里 , Pouria Peykani Sani公司 , 阿米罗申·莫拉迪 , 马苏德·卡纳利扎德·伊马尼 , 埃米尔·侯赛因·巴兹卡内伊 , 侯赛因·阿萨迪 :
为新兴快速存储设备重新构建I/O缓存。 542-555 约书亚·兰德格拉夫 , 马修·佐丹奴 , 埃丝特·尹 , 克里斯托弗·罗斯巴赫 :
FPGA驱动I/O的可重构虚拟内存。 556-571 王浩源 , 斯科特·比默 :
RepCut:具有复制辅助分区的超线性并行RTL模拟。 572-585年 莫伊恩·哈兹雷 , 亚历克斯·福兰西奇 , 乔治·C·帕彭 , 亚历克斯·C·斯诺伦 , 亚伦·舒尔曼 :
玫瑰花蕾:让FPGA加速的Middlebox开发更令人愉悦。 586-605 凯文·莱弗 , 维格内什·伊耶 , 大卫·比安科林 , 乔纳森·巴赫拉赫 , 鲍里沃耶·尼科利奇 , 库什克森 :
RTL硬件语言的模拟器独立覆盖。 606-615 Blaise Tine公司 , 瓦伦·萨克塞纳 , 桑托什·斯里瓦桑 , 约书亚·R·辛普森 , 法迪·阿尔扎马尔 , 利安·库珀 , 海森·金 :
Skybox:可编程RISC-V GPU上的开源图形渲染。 616-630 杨方凯 , 卢旺(Lu Wang) , 徐振宇 , 觉章 , 李立群 , 薄巧 , 卡米尔时装设计师 , 切坦·班萨尔 , Soumya公羊 , 司勤 , 甄玛 , 尼格尼戈·戈伊里 , 埃利·科尔特斯 , 特里·杨 , 维克托·吕勒 , 萨拉文·拉杰莫汉 , 林清伟 , 张冬梅 :
Snape:采用实时和按需虚拟机混合的可靠低成本计算。 631-643 刘杰松 , 张峰(音) , 关嘉伟 , 新宣松 , 郭晓光 , 杜晓勇 , 沈喜鹏 :
用于在微控制器上实现深度学习的节省空间TREC。 644-659 叶子豪 , 赖瑞航 , 邵俊如 , 陈天奇(Tianqi Chen) , 路易斯·塞兹 :
SparseTIR:深度学习中稀疏编译的可组合抽象。 660-678 谭祖军 , Yebin Chon先生 , 克鲁斯 , 约翰内斯·多尔弗特 , 徐紫阳 , 布莱恩寄宿 , 西蒙·坎帕诺尼 , 戴维·奥古斯特 :
SPLENDID:支持并行LLVM-IR增强的交互式开发自然反编译。 679-693 Iacovos G.科洛卡西 , 詹诺斯·埃夫多鲁 , Shoaib Akram公司 , 克里斯托斯·科扎尼蒂 , 阿纳斯塔西奥斯·帕帕吉安尼斯 , Foivos S.Zakkak公司 , 波利维奥斯·普拉蒂卡基斯 , 安吉洛斯·比拉斯 :
TeraHeap:减少托管大数据框架中的内存压力。 694-709 Olivia Hsu , 麦克斯韦奇怪 , 里特维克·夏尔马 , Jaeyeon Won公司 , 昆勒·奥卢科顿 , 乔尔·埃默 , 马克·霍洛维茨 , 弗雷德里克·科尔斯塔德 :
稀疏抽象机器。 710-726 Padmapriya Duraisamy公司 , 魏旭 , 斯科特·黑尔 , 拉维·拉贾尔 , 大卫·E·库勒 , 徐志毅 , 嘉宁风扇 , 克里斯托弗·肯内利 , 比尔·麦克洛斯基 , 达尼耶拉·米加洛维奇 , 布莱恩·莫里斯 , 奇兰吉特·穆克吉 , 任靖良 , 格雷格·塞伦 , 保罗·特纳 , 卡洛斯·维拉维娅 , 帕塔萨拉提·兰加纳坦 , 阿明·瓦达特 :
面向仓库级内存分层的适应性系统体系结构。 727-741 哈桑·马鲁夫 , 王浩 , 阿比谢克·达诺蒂亚 , 约翰内斯·韦纳 , 尼科特·阿加瓦尔 , 帕拉布·巴塔查里亚 , 克里斯·彼得尔森 , 莫沙拉夫·乔杜里 , Shobhit O.Kanaugia商店 , Prakash Chauhan公司 :
TPP:支持CXL的分层内存的透明页面放置。 742-755 Zizhan Chen先生 , 邵子立 :
Android应用程序的透明运行时更改处理。 756-770 赵子瑞Neil Zhao , 亚当-莫里森 , 克里斯托弗·弗莱彻 , 约塞普·托雷拉斯 :
Untangle:设计低泄漏、高性能动态分区方案的原则框架。 771-788 袁峰 , 许英特 :
非确定性量子程序的验证。 789-805年 左格非 , 马嘉诚 , 安德鲁·奎因 , 巴里斯·卡西奇 :
视频:可配置硬件的录制重播。 806-820