2024年第22届CGO:英国爱丁堡
托比亚斯·格罗瑟 , 克里斯托夫·杜巴赫 , 米歇尔·斯特沃 , 薛晶凌 , 吉尔赫梅·奥托尼 , 埃尔南多·马格诺·昆托·佩雷拉 :
IEEE/ACM代码生成和优化国际研讨会,CGO 2024,英国爱丁堡,2024年3月2-6日。 电气与电子工程师协会 2024 ,国际标准图书编号 979-8-3503-9509-9 吉尔赫梅·奥托尼 , 费尔南多·佩雷拉 , 米歇尔·斯特沃 , 薛晶凌 :
欢迎来自节目主持人。 v-vi型 阿米尔·谢赫哈 , 马修·霍特 , 施德·哈希米安 :
稀疏微分张量代数编译器。 1-12 马利斯·贾亚韦拉 , 马丁·孔 , 王彦之(Yanzhi Wang) , 大卫·R·凯利 :
GPU上仿射程序的能量感知瓷砖大小选择。 13月27日 Gianpietro Consolaro公司 , Zhen Zhang先生 , 哈里诺姆·拉扎纳贾托 , 纳尔逊·洛辛 , 纳西姆·丘拉克 , 阿迪拉·苏松吉 , 阿图尔·塞萨尔·阿劳霍·阿尔维斯 , 张仁伟 , 丹尼斯·巴托 , 科琳·安科特 , 塞德里克·巴斯托尔 :
PolyTOPS:可配置的灵活多面体调度器。 28-40 大田胜美 , 萨曼·阿马拉辛格 :
AskIt:使用大型语言模型编程的统一编程接口。 41-54 沃尔克搜索者 , 克里斯·卡明斯 , 默里·科尔 , 比约恩·弗兰克 , 金·哈泽尔伍德 , 休皮革 :
通过自动发现和优化揭示编译器启发。 55-66 Jordi Armengol-Estapé , 杰克逊·伍德拉夫 , 克里斯·卡明斯 , 迈克尔·F·P·奥博伊尔 :
SLaDe:用于优化汇编的可移植小型语言模型解码器。 67-80 米拉德·哈基米 , Arrvindh Shriraman公司 :
TapeFlow:自动区分中的流式渐变磁带。 81-92 阿比纳夫·扬达 , 赛义德·马莱基 , 玛丽亚姆·梅赫里·德纳维 , 穆苏瓦蒂夫人 , 奥利·萨里基维 :
相关GPU内核的精细同步框架。 93-105 阿尔尼斯·穆托维 , 乔治·乔治库迪斯 , Konstantinos Parasysis公司 , 廖春华 , 伊格纳西奥·拉古纳 , 伯恩哈德·斯特芬 :
通过GPU上的控制流展开和循环展开提高性能。 106-118 伊万·伊万诺夫 , 奥列克桑德·齐恩科 , 延斯·多姆克 , 东藤俊雄 , 威廉·S·摩西 :
重新定位和重新指定GPU工作负载以实现性能便携性。 119-132 瑞安·斯旺 , 穆罕默德·奥萨马 , Karthik Sangaiah公司 , 贾拉尔·马哈茂德 :
Seer:不规则问题的预测运行时内核选择。 133-142 尼古拉斯·博姆·阿戈斯蒂尼 , 裘德·哈里斯 , 佩里·吉布森 , 马利斯·贾亚韦拉 , 诺姆·鲁宾 , 安东尼诺·图米奥 , 何塞·L·阿贝兰 , 何塞·卡诺 , 大卫·R·凯利 :
AXI4MLIR:用于自定义基于AXI的加速器的用户驱动自动主机代码生成。 143-157 朱明政 , 郝福 , 吴军 , 张驰(Chi Zhang) , 魏燮 , 李向阳 :
Ecmas:表面代码的有效电路映射和调度。 158-169 关晓峰 , 郝周 , 国庆报 , 李汉东 , 梁祝 , 建国耀 :
PresCount:减少银行冲突的有效寄存器分配。 170-181 阿德里安·卡斯特略 , 朱利安·贝拉维塔 , 格蕾丝·丁 , Yuka Ikarashi先生 , 赫克特·马丁内斯 :
用Exo处理矩阵乘法微内核的生成。 182-193 路易莎·西科里尼 , 菲利波·卡洛尼 , 马可·桑坦布罗基奥 , 戴维德·康菲科尼 :
一个自动控制所有规则:超越多个正则表达式的执行。 193-206 本·L·蒂泽 :
到底是谁的基线编译器? 207-220 韩若兵 , 赵继生 , 海森·金 :
通过使编译器有状态,实现精细增量构建。 221-232 亚历克西斯·恩格尔克 , 托比亚斯·施瓦兹 :
查询编译编译器框架的编译时分析。 233-244 崔金库 , 赵启东 , 郝月明 , 徐柳 :
DrPy:指出多层Python应用程序中内存使用效率低下。 245-257 雨果·雷蒙德 , 珍妮·卢克·贝切内克 , 米卡·布赖迪 , 塞巴斯蒂安·福库 , 伊莎贝尔·普奥 , 埃尔文·罗侯 :
示意图:间歇系统的编译时检查点放置和内存分配。 258-269 乔纳森·范德·克鲁斯 , 克里斯托夫·杜巴赫 :
使用等式饱和法识别最简函数数组语言的潜在习语。 270至282 优善高 , Bernd Burgsteller公司 :
BEC:针对软错误的可靠性的位级静态分析。 283-295 李浩峰 , 杰露 , 海宁梦 , 曹利庆 , 连丽 , 林高 :
通过流敏感性优化提高多解IFDS算法的性能。 296-307 汤米·麦克米奇 , 内森·格雷纳 , 彼得·钟 , 费德里科·索赛 , Atmn Patel公司 , 西蒙·坎帕诺尼 :
以SSA表格表示数据收集。 308-321 何文磊 , 余洪涛 , 王磊(Lei Wang) , Taewook哦 :
使用上下文敏感度和伪仪器对基于采样的PGO进行改进。 322-333 卢克·格森 , 李·史密斯 :
使用松弛内存模型进行编译器测试。 334-348 范玉友 , 约翰·雷格尔 :
LLVM的高吞吐量、形式化方法辅助模糊。 349-358 塞奥·巴罗莱特 , 克里斯托夫·吉隆 , 曼纽尔·塞尔瓦 , 弗朗索瓦·布罗奎迪斯 , 弗洛伦特·布切兹·蒂查杜 , 法布里斯·拉斯特罗 :
EasyTracker:一个用于控制和检查程序执行的Python库。 359-372 郭玉欣 , 亚历克斯·W·查德威克 , 马尔顿-鄂尔多斯 , 乌特帕尔·博拉 , 伊利亚斯·沃吉古卡斯 , 贾科莫·加布里埃尔 , 蒂莫西·琼斯 :
OptiWISE:结合采样和仪器进行颗粒CPI分析。 第373-385页 赵启东 , 米林·查比 , 徐柳 :
EasyView:将性能配置文件引入集成开发环境。 386-398 埃托雷·蒂奥托 , 维克多·佩里兹 , 惠特尼·曾 , 卢卡斯·索默 , 朱利安·奥珀曼 , 维克托·洛缪勒 , 梅迪·戈里 , 詹姆斯·布罗德曼 :
构建基于MLIR的SYCL编译器的经验。 399-410 乔治·弗拉德·塞奥克 , 德米特里·雪琴科 , 米林·查比 :
揭示和克服企业微服务中的Goroutine泄漏:一种动态分析方法。 411-422 金湖江 , 梁朝义 , 董荣超 , 杨朝晖 , 周忠军 , 王文文(Wenwen Wang) , 彭昌紫杉 , 张伟华 :
使用自动学习的翻译规则的系统级动态二进制转换器。 423-434 加桑·肖巴吉 , 皮纳尔·穆扬·奥泽利克 , 乔什·赫顿 , 布鲁斯·林克 , 弗拉迪斯拉夫·马利申科 , 奥斯汀角 , 罗纳尔多·拉米雷斯-奥尔特加 , 沃尔·斯科特·戈登 :
GPU上GPU的指令调度。 435-447 Qiang Fu(功夫) , 托马斯·罗林格 , H.Howie Huang先生 :
JITSPMM:用于加速稀疏矩阵乘法的实时指令生成。 448-459 李建辉 , 秦镇南 , 伊杰梅(Yijie Mei) , 崔京泽 , 宋云飞 , 陈慈勇 , 张一飞 , 杜龙胜 , 程显航(Xianhang Cheng) , 金百惠 , 张燕(音译) , 杰森·叶 , 埃里克·林 , 丹·拉弗里 :
oneDNN图形编译器:一种用于高性能深度学习编译的混合方法。 460-470