第33届FPL 2023:瑞典哥德堡
内尔·曼滕斯 , 莱昂内尔·索萨 , 佩德罗·特拉科索 , Nikela Papadopoulou , Ioannis Sourdis公司 :
第33届现场可编程逻辑和应用国际会议,FPL 2023,瑞典哥德堡,2023年9月4-8日。 电气与电子工程师协会 2023 ,国际标准图书编号 979-8-3503-4151-5 Ioannis Sourdis公司 , 内尔·曼滕斯 , 莱昂内尔·索萨 , 佩德罗·特拉科索 :
前言。 十三 罗伯特·萨法尔奇克 , 赛义德·瓦卡尔·纳比 , 维姆·范德鲍维德 :
编译器在高级综合中发现了不规则代码的动态调度。 1-9 加布里埃尔·罗德里格斯运河 , 尼克布朗 , 蒂姆·戴克斯 , 杰西卡·琼斯 , Utz-Uwe Haus公司 :
Fortran高级综合:减少FPGA上加速HPC代码的障碍。 10-18 路易斯·勒杜 , 马克·卡萨斯 :
高效数字分类计算的开源框架。 19-26 韩云涛 , 刘强(音) :
HPTA:基于FPGA的高性能变压器加速器。 27-33 陈汉宁(Hanning Chen) , 阿里·扎克里 , 费雯 , 哈姆扎·埃尔拉穆尼·巴尔坎 , 莫森·伊马尼 :
HyperGRAF:基于FPGA的超维图形推理加速。 34-41 李世清 , Shien Zhu先生 , 骆向中 , 陶罗 , 刘伟晨 :
一种基于嵌入式FPGA的高效稀疏LSTM加速器,具有面向带宽的修剪功能。 42-48 赵田东 , 思源苗族 , 卢少强 , 曹嘉林 , Jun Qiu先生 , 小石 , 王坤(Kun Wang) , 何磊(Lei He) :
变长输入变压器的令牌打包。 49-56 Kimia Talaei Khoozani先生 , 阿拉什·艾哈迈迪安·德科尔迪 , 沃恩·贝茨 :
Titan 2.0:通过现代架构捕获实现开源CAD评估。 57-64 谭恩恩(Tan Nguyen) , 扎卡里·布莱尔 , 斯蒂芬·纽恩多弗 , 约翰·沃兹内克 :
SPADES:通用可编程逻辑的有效设计流程。 65-71 陈瑞晨 , 盛耀路 , 穆罕默德·埃尔加马尔 , 彼得·春 , 沃恩·贝茨 , 地牛 :
VPR-Gym:探索FPGA布局优化中AI技术的平台。 72-78 尼古拉·米勒 , 谢尔盖·梅施科夫 , 丹尼斯·R·E·格纳德 , Mehdi B.Tahoori公司 , 阿米尔·莫拉迪 :
FPGA映射设计的自动屏蔽。 79-85 Petros Toupas公司 , 克里斯托斯·萨瓦斯·布加尼斯 , 迪米特里奥斯·茨瓦拉斯 :
fpgaHART:面向吞吐量的3D细胞神经网络加速工具流,用于FPGA上的HAR。 86-92 海双扇 , 吴敬雅 , 卢文艳 , 李晓伟 , 桂海燕 :
Co-ViSu:利用编解码器信息重用的视频超分辨率加速器。 93-100 陆洋余 , 陆益珍 , 梅格纳·曼达瓦 , 爱德华·里希特 , 维克拉姆·夏尔马·梅特霍迪 , Seungwon Min先生 , 文美·W·Hwu , 陈德铭(Deming Chen) :
FSSD:基于FPGA的SSD仿真器。 101-108 阿拉法特·卡比尔先生 , 埃桑·卡比尔 , 约书亚·霍利斯 , 埃利·利维·麦凯 , Atiyehsadat Panahi公司 , 杰森·巴科斯 , 黄妙清 , 大卫·安德鲁 :
FPGA处理器内存体系结构(PIM):覆盖还是大修? 109-115 刘鹏宇 , Zihan Zhang先生 , 陈寅 , 陈丽燕 , 姜建飞 , 秦王 , 毛志刚 , Naifeng Jing公司 :
高性能空间可编程体系结构中集成映射的管道平衡。 116-122 Shaden M.Alismail公司 , 德克·科赫 :
FPGA上运行时可重构系统的高效资源调度。 123-129 阿明·莫哈格 , 沃恩·贝茨 :
拆墙:FPGA的统一高效集群内和集群间路由。 130-136 雷米·加西亚 , 阿纳斯塔西亚·沃尔科娃 :
多重常数乘法:从目标常数到优化的流水线加法器图。 137-143 卢卡斯·斯塔西提斯 , 兹索尔特·伊斯特温 :
FPGA上Hestenes-Jacobi奇异值分解的优化技术。 144-150 何塞·奥利弗 , 卡洛斯·阿尔瓦雷斯 , 特蕾莎·塞韦罗 , 泽维尔·马托雷尔 , 约翰·戴维斯 , 爱德华·伊瓜德 :
通过块行压缩加速FPGA上的SpMV:一种基于任务的方法。 151-158 宋长军 , 唐永明 , 刘济源 , Sige Bian公司 , 邓丹妮 , 何莉 :
MSDF-SGD:用于任意精度训练的最重要数字第一随机梯度下降。 159-165 约书亚·兰特 , 埃马努伊尔·斯科达拉基斯 , Kyriakos Paraskevas公司 , 威廉·汤姆斯 , 米凯尔·卢扬 , 约翰·古达克 :
DiAD-数据中心FPGA的分布式加速。 166-173 杨扬 , 威航龙 , 拉戈帕尔·坎南 , 维克托·普拉桑纳 :
使用动态数据布局的同态加密中FPGA旋转加速。 174-181 策国 , 迭戈·库佩罗 , 韦恩·卢克 , 约书亚·M·莱文 , 亚历山大·沃伦 , 皮特·布鲁克斯 :
FPGA—使用条件独立性测试优先级加速因果发现。 182-188 托比亚斯·哈恩 , 斯特凡·维尔德曼 , 尤尔根·蒂奇 :
SPEAR-JSON:选择性解析JSON以在FPGA上实现加速流处理。 189-196 赵宝泽 , 黄文锦 , 黄一华 :
基于Xilinx UltraScale和UltraScale+FPGA的新型NeRF硬件加速器。 197-203 余哲文 , 克里斯托斯·萨瓦斯·布加尼斯 :
Mixed-TD:具有层特定张量分解的高效神经网络加速器。 204-211 斯特凡·阿比卡拉姆 , 丛浩 :
GNNBuilder:通用图神经网络加速器生成、模拟和优化的自动化框架。 212-218 Paul Chen(保罗·陈) , 帕万·曼朱纳特 , 萨辛杜·维杰拉通 , 张炳义 , 维克托·普拉桑纳 :
利用通用架构的片上异构性加速GNN推理。 219-227 陈瑞琪(Ruiqi Chen) , 张浩阳 , 李顺(音) , 恩浩堂 , 于军(Jun Yu) , 王坤(Kun Wang) :
Graph OPU:一种用于图形神经网络的高度集成的基于FPGA的叠加处理器。 228-234 沙什瓦特·坎德瓦尔 , Shanker Shreejith公司 :
探索用于汽车CAN入侵检测的高量化神经网络。 235-241 罗子章 , 陆立强 , 亿城金 , 连城佳 , 云亮(Yun Liang) :
葫芦:在FPGA上使用收缩阵列链来加速注意力。 242-247 志强鹊 , 刘硕 , 马库斯·罗格利恩 , 策国 , 何塞·加布里埃尔·库蒂尼奥 , 韦恩·卢克 :
MetaML:自动化可定制的跨阶段设计流程,以加速深度学习。 248-252 穆罕默德·马扎利 , 于高 , 保罗·周 :
为数据中心划分大型、多功能PGA应用程序。 253-258 文森特·迈尔斯 , 迈克尔·赫芬布鲁克 , 丹尼斯侏儒 , 梅迪·巴拉达兰·塔胡里 :
基于功率指纹的神经网络FPGA加速器远程识别。 259-264 安德鲁·布特罗斯 , 斯蒂芬·莫尔 , 沃恩·贝茨 :
一个全新的世界:如何构建超越FPGA的可重构加速设备? 265-270 李惠民 , 菲利普·里格 , 沙扎·泽图尼 , 斯捷潘·皮切克 , 艾哈迈德·雷扎·萨德吉 :
FLAIRS:FPGA—加速推理抵抗和安全联合学习。 271-276 马丁·兰哈默 , 乔治·A·康斯坦丁(George A.Constantinides) :
eGPU:用于FPGA的750 MHz级软GPGPU。 277-282 白月音 , 郝周 , 赵克清 , Manting Zhang(张曼廷) , 陈建立 , 于军(Jun Yu) , 王坤(Kun Wang) :
LTrans-OPU:一种用于变压器网络的基于FPGA的低延迟覆盖处理器。 283-287 亚历山大·蒙哥马利·科尔科兰 , 于哲文 , 程建义 , 克里斯托斯·萨瓦斯·布加尼斯 :
PASS:利用流媒体架构中的激活后稀疏性实现CNN加速。 288-293 黄世玉 , 杨云晨 , 于汝苏 , Bo-Cheng赖 , 哈维尔·杜阿尔特 , 斯科特·哈克 , 许世杰 , 金宣虎 , 马克·S·纽鲍尔 :
用于FPGA粒子轨迹跟踪的低延迟边缘分类GNN。 294-298 瓦伊巴夫·卡舍拉 , 悉达恩·贾恩(Siddhant Jain) , 阿比谢克·巴纳吉 , 苏雷什·普里尼 :
在FPGA上使用混合二元线性搜索数据结构构建低延迟订单簿。 299-304 周广磊 , 米尔贾娜·斯托伊洛维奇 , 杰森·海尔赫·安德森 :
GRAMM:基于启发式的快速CGRA应用映射,用于查找图的子图。 305-310 海登·库克 , 泽弗拉姆·特里普 , 布拉德·哈钦斯 , 杰弗里·戈德斯 :
提高FPGA CRO PUF的可靠性。 311-316 陈瑞琪(Ruiqi Chen) , 张浩阳 , 于军(Jun Yu) , 王坤(Kun Wang) :
FPGA利用GAT加速多源转移学习,用于靶向孤儿G蛋白偶联受体配体的生物活性。 317-321 杨柳 , 何晓明 , 于军(Jun Yu) , 王坤(Kun Wang) :
DIF-LUT:FPGA上非线性激活函数的简单但可扩展的近似。 322-326 埃桑·卡比尔 , 丹尼尔·科布尔 , Joud N.Satme公司 , 奥斯汀·R·J·唐尼 , 杰森·巴科斯 , 大卫·安德鲁 , 黄妙卿 :
加速基于LSTM的高速动态系统模型。 327-332 乔纳斯·克劳特 , 保罗·根斯勒 , 格洛丽亚·塞潘塔 , 胡萨姆·阿姆鲁奇 , Mehdi B.Tahoori公司 :
FPGA上AI实现的压力弹性。 333-338 克里斯托夫·尼曼 , 迈克尔·雷特菲尔德 , 德克·蒂默曼 :
FPGA上AVS传感器柔性布置和布线的新策略。 339-344 紫衣羊 , 苏哈伊布·A·法赫米 :
探索分布式无服务器计算的FPGA加速。 345-346 菲利普·克劳斯基 , 贾斯汀·纳普海德 , 本诺·斯塔贝纳克 :
使用FPGA集群进行分布式CNN训练的挑战。 347-348 鲁宾·马西亚斯 , 塞尔吉奥·贝纳贝 , 卡洛斯·冈萨雷斯 :
使用Intel oneAPI for FPGA加速ATDCA算法从高光谱图像中提取端点。 349-350 藏真牙 , 乌维·多林斯基 , 彼得罗·吉利奥 , 斯特凡诺·切鲁宾 , 梅迪·戈里 , 杨树凡 :
为可配置设备构建可重用和可扩展的自动编译器基础结构。 351-352 郭小让 , 马丁·舒尔茨 :
一种可扩展的跨技术量子控制处理器。 353-354 朱旭琦 , 聪高 , 桑吉特·萨哈 , 翟晓军 , 克劳斯·D·麦克唐纳-迈耶 :
高效异构MPSoC DNN加速器运行时调整的贝叶斯优化。 355-356 维罗尼亚伊斯干达 , 穆罕默德·阿卜杜勒·加尼 , 戴安娜·戈林格 :
可重构近内存计算系统的性能评估和原型制作。 357-358 费利克斯·詹茨奇 :
用于探索RadioML自定义FPGA加速器的硬件AutoML。 359-360 汉斯·雅各布·达姆斯加德 , 阿列克桑德·奥梅托夫 , 贾里·努尔米 :
用CGRAgen实现粗训练可重构近似计算。 361-362 贾斯汀·纳普海德 , 菲利普·克劳斯基 , 本诺·斯塔贝纳克 :
演示NADA:FPGA集群上分布式CNN培训的工作流。 363 迈克尔·奥菲尔 , 安德烈亚斯·莱伊 , 斯文·海格 :
HashCache:基于FPGA的弹性数据包处理的高性能状态跟踪。 364 默特尔·沙阿 , 雅各布燕鸥 , 德克·科赫 :
著名演示:Sky130上的开源FPGA。 365 赵云怡 , 云佳霞 , 鲁伊·C·V·卢雷罗 , Hubin Zhao(湖滨赵) , 乌维·多林斯基 , 杨树凡 :
FPL演示:用于异构平台的基于学习的运动伪影检测器。 366