ISPASS 2023:美国北卡罗来纳州罗利
IEEE系统和软件性能分析国际研讨会,ISPASS 2023,美国北卡罗来纳州罗利,2023年4月23日至25日。 电气与电子工程师协会 2023 ,国际标准图书编号 979-8-3503-9739-0 吉恩瓦·郑(Geonhwa Jeong) , 比卡什·夏尔马 , 尼克·特雷尔 , 阿比谢克·达诺蒂亚 , 赵志伟 , 尼科特·阿加瓦尔 , 阿伦·凯加里瓦尔 , 图沙·克里希纳 :
数据中心中数据压缩的特征。 1-12 法特梅赫·加西米 , 卢卡斯·利特克 , 马格努斯·贾勒 :
PES:能量收集物联网系统的能量和吞吐量模型。 13-23 Jiao Ma公司 , 徐策玉 , 丽莎·吴·威尔斯 :
PyTFHE:用于完全同态加密应用程序的端到端编译和执行框架。 24-34 胡安·戈麦斯·卢纳 , 郭玉欣 , 西尔文·布罗卡 , 朱利安·莱格里尔 , 雷米·西马多莫 , 杰拉尔多·F·奥利维拉 , 加甘迪普·辛格 , Onur Mutlu公司 :
在以内存为中心的计算系统上评估机器学习工作量。 35-49 Shruti Yadav Narayana公司 , 捷通 , 阿尼什·克里希纳库玛 , 努里耶·伊尔迪林 , 艾米丽·施莱弗 , 马赫什·凯特卡 , 尤米特·奥格拉斯 :
MQL:数据中心网络的ML-Assisted Queuing Latency Analysis。 50-60 吉诺·查孔 , 内森·戈贝尔 , 克里希南德拉·纳塞拉 , 保罗·V·格拉茨 , 丹尼尔·吉梅内斯(Daniel A.Jiménez) :
软件指令预取对攻击性前端的影响的表征。 61-70 埃米利奥·多明古兹·桑切斯 , 阿尔贝托·罗斯 :
MBPlib:模块化分支预测库。 71-80 约翰·阿利斯泰尔·克雷塞尔 , 吉列尔莫·卡拉汉 , 科斯敏·戈戈文 , 米凯尔·卢扬 :
评估64位RISC-V上动态二进制修改优化的影响。 81-91 安娜·岳 , 三亚姆·梅塔 :
一种面向应用程序的混合CPU体系结构设计方法。 92-102 约翰逊·乌梅克 , 尼尔·帕特尔 , 亚历克斯·曼利 , 阿明·马曼迪普尔 , Heechul Yun先生 , 穆罕默德·阿利安 :
分析gem5模拟器。 103-113 马科斯·基尼戈斯 , 哈维尔·纳瓦里达斯 , 何塞·安东尼奥·帕斯科尔 , 米凯尔·卢扬 :
硅光子开关结构的一种新的模拟方法。 114-123 斯汀·埃弗曼(Stijn Eyerman) , 萨姆·范登·斯汀 , 威姆·海尔曼 , 易卜拉欣·胡尔 :
在解耦功能优先模拟中模拟错误路径指令。 124-133 亚历山大·汉金 , 莉莲五旬节 , Min东月 , 大卫·布鲁克斯 , 顾延伟 :
未来是寒冷还是高大? 低温和3D嵌入式缓存的设计空间探索。 134-144 莫欣山 , 丹尼斯·古尔文 , 贾里德·奈 , 蔡文鼎 , 奥马尔·汗 :
MergePath-SpMM:用于图形神经网络加速的并行稀疏矩阵算法。 145-156 Shvetank Prakash公司 , 蒂姆·卡拿汉 , 约瑟夫·布沙古 , 科尔比·R·班伯里 , 艾伦·V·格林 , 沃顿 , 蒂姆·安塞尔 , 维杰·贾纳帕·雷迪 :
CFU游乐场:FPGA上微型机器学习(TinyML)加速的全套开源框架。 157-167 马修·约瑟夫·阿迪莱塔 , 杰斯明·贾汉·提提 , 埃马努伊尔·伊安尼斯·法萨拉基斯 , Gerasimos Gerogannis公司 , 罗伯特·阿道夫 , 罗伯特·本克 , 西德哈特·卡西亚普 , 塞缪尔·夏 , Kartik Lakhotia公司 , 法布里奇奥·佩里尼 , 顾延伟 , 大卫·布鲁克斯 :
Intel上图卷积网络可伸缩性的表征 ® 皮亚马。 168-177 刘竹仁 , 张守哲 , 贾斯汀·加里格斯 , 赵慧(音) :
基因组-GPU:GPU加速基因组分析的基准套件。 178-188 劳伦·比尔纳基 , Biniyam Mengist Tiruye公司 , 梅隆·泽里亨·德米西 , Fitsum Assamnew Andargie公司 , 布兰登·里根 , 托德·奥斯汀 :
探索数据发布程序的效率。 189-200 徐燕文(Yanwen Xu) , 李安(Ang Li) , 泰勒·索伦森 :
红杉:灵活和便携式异构树遍历工作负载。 201-213 维格内什·巴拉吉 , 尼尔·克莱顿·克雷戈 , 阿默·贾勒尔 , 斯蒂芬·凯克勒 :
稀疏线性代数优化中基于社区的矩阵重排序。 214-223 马哈茂德·纳德兰·塔汉 , 侯赛因·塞耶德·阿盖伊 , Lieven Eeckhout公司 :
筛选:分层GPU计算工作量采样。 224-234 Maurus项目 , 杰拉尔多·F·奥利维拉 , 胡安·戈梅斯·卢纳 , 穆罕默德·萨德罗萨达蒂 , 郭玉欣 , Onur Mutlu公司 :
TransPimLib:内存中处理系统的高效超越函数。 235-247 Seokjin围棋 , 李贤武 , 金俊成(Junsung Kim) , 李纪元(Jiwon Lee) , Myung Kuk Yoon先生 , Won Woo Ro公司 :
早期适配器:用于主动UVM内存管理的自适应框架。 248-258 穆罕默德·侯赛因·奥利亚伊 , 克里斯托弗·吴 , 亚历山德拉(萨沙)费多罗娃 , Mieszko Lis公司 :
Sunstone:用于在空间加速器上映射张量代数的可扩展且通用的调度器。 259-271 Deepraj Soni公司 , 内加·奈达 , 张乃峰(Naifeng Zhang) , 本尼迪克特·雷瓦尔 , 霍默·加米尔 , 本杰明·海曼 , 穆罕默德·纳比尔 , 艾哈迈德·巴达维 , 尤里·波利亚科夫 , 凯利·卡尼达 , 马苏德·佩德拉姆 , 米歇尔·马尼亚塔科斯 , 大卫·布鲁斯·考辛斯 , 弗兰兹·弗朗切蒂 , 马修·弗伦奇 , 安德鲁·施密特 , 布兰登·里根 :
RPU:环处理单元。 272-282 威廉·元 , Taekyung Heo公司 , 赛义德·拉希迪 , 斯里尼瓦斯·斯里德哈兰 , 苏达珊·斯里尼瓦桑 , 图沙·克里希纳 :
ASTRA-sim2.0:大规模大模型训练的分层网络和分解系统建模。 283-294 马齐亚尔·阿米拉斯基 , 大卫·沃纳 , 亚历山大·汉金 , 朱利安·塞博特 , 考希克·维迪亚纳桑 , 马可·亨普斯特德 :
Boreas:一种使用机器学习和硬件遥测的高级热点的经济有效的缓解方法。 295-305 迪克莎·穆尔坎达尼 , 乔伊吉特·昆都 , 弗雷德里克·鲁伦斯 , 彼得·弗兰克斯 , 蒂蒙·埃文布利吉 , 马努·佩鲁姆库尼尔 :
AMPeD:变压器分布式训练性能分析模型。 306-315 迈克尔·吉尔伯特 , 吴燕楠(音) , Angshuman Parashar公司 , 薇薇安·斯泽 , Joel S.Emer公司 :
LoopTree:实现对融合层数据流加速器的探索。 316-318 三亚斯里瓦斯塔瓦 , 泰勒·索伦森 :
GPU上图形处理的度-软件内核映射。 319-321 Mahita Nagabhiru先生 , 格雷格·伯德 :
lfbench:一个无锁的微基准测试套件。 322-324 金哲明 , 杰弗里·维特 :
提高SYCL编程模型性能可移植性的基准套件。 325-327 汤姆·格林特 , 雅利安古普塔 , 丹尼尔·吉夫特森 , 高拉夫·沙阿 , 弗拉杰什·帕特尔 , 鲁奇特·楚达萨马 , Sukanya更多 , 乔伊斯·梅基 :
最佳设计点对FPGA中DNN加速器性能指标的影响。 328-330 莉娜·萨瓦利亚 , 格兰特·德尔杰维奇 :
使用层次PCA描述工作负载。 331-333 黄景汉 , 家七楼 , 孙燕 , 王天晨 , 李恩景(Eun Kyung Lee) , 南宋金 :
分析SLO约束下带有SmartNIC的服务器的能效。 334-336 阿萨纳西奥斯·科尔德拉斯 , 萨那西斯皮鲁 , 斯皮罗斯·沃加里斯(Spyros Voulgaris) , Vasileios Megalooikonomou公司 , 尼科斯·德利吉安尼斯 :
KORDI:Apache Spark流的实时性能和成本优化框架。 337-339 玛丽亚姆·巴拜 , 阿亚兹·阿克拉姆 , Jason Lowe-Power公司 :
支持新兴内存系统DRAM缓存的设计空间探索。 340-342 李颖 , 孙一凡 , Adwait慢跑 :
基于回归的GPU上DNN执行端到端延迟预测模型。 343-345 马西莫·科鲁齐 , 阿莫斯·布罗科 , 帕特里齐奥·孔图 , 蒂齐亚诺·雷迪 :
一致哈希算法的调查和比较。 346-348 汤姆·格林特 , Chandan Kumar贾 , 马努·阿瓦西 , 乔伊斯·梅基 :
常规、近内存和内存DNN加速器分析。 349-351 斯塔夫鲁拉·佐佐拉 , 穆罕默德·瓦卡尔·阿资哈尔 , 佩德罗·特拉科索 :
彩虹:用于DL加速器芯片内存的多维软硬件协同设计。 352-354 阿恩·西蒙斯 , 林燕梅 , 史蒂文·科勒曼 , 普亚·霍什曼 , 塞巴斯蒂安·卡尔 , 玛丽安·维赫斯特 :
流:多核DNN加速器上细粒度层融合的建模框架。 355-357
![](https://dblp.org/img/cog.dark.24x24.png)