周培培 0001
人员信息
附属: 美国宾夕法尼亚州匹兹堡大学 附属机构(博士): 美国加利福尼亚州洛杉矶加利福尼亚大学
其他同名人员
优化列表
2020年–今天
2024 [第19条] 金明庄 , 杨卓平 , 《时新记》 , 亨黄(Heng Huang) , 亚历克斯·K·琼斯 , 胡静桐 , Yiyu Shi公司 , 周培培 :
SSR:用于变压器加速中延迟吞吐量权衡的空间顺序混合体系结构。 FPGA(现场可编程门阵列) 2024 : 55-66 [电子1] 拉娜·约西波维奇 , 周培培 , Shreejith Shanker公司 , 乔昂·M·P·卡多佐 , 杰森·安德森 , 柴田裕一郎 :
第十四届高效加速器和可重构技术国际研讨会论文集,2024年6月19-21日,葡萄牙波尔图,心脏2024。 ACM公司 2024 [目录] 【i15】 时新记 , 杨卓平 , 斯蒂芬·卡洪 , 亚历克斯·K·琼斯 , 周培培 :
使用加速器对云服务器进行碳建模。 CoRR公司 abs/2401.06270 ( 2024 ) [第14条] 金明庄 , 杨卓平 , 《时新记》 , 亨黄(Heng Huang) , 亚历克斯·K·琼斯 , 胡静桐 , Yiyu Shi公司 , 周培培 :
SSR:用于变压器加速中延迟吞吐量权衡的空间顺序混合体系结构。 CoRR公司 abs/2401.10417 ( 2024 ) [i13] 《时新记》 , 杨卓平 , 陈兴珍 , 胡静桐 , 石一宇 , 亚历克斯·K·琼斯 , 周培培 :
面向深度学习推理的数据中心级碳建模和优化。 CoRR公司 abs/2403.04976 ( 2024 ) 2023 [j5] 塞巴斯蒂安·奥利维尔 , 胜利(Sheng Li) , 岳堂 , 斯蒂芬·卡洪 , 瑞安·卡金纳普 , 查亚尼卡·乔杜里 , 周培培 , 唐旭龙 , 胡静桐 , 亚历克斯·K·琼斯 :
边缘的可持续人工智能处理。 IEEE微型 43 ( 1 ) : 19-28 ( 2023 ) [第18条] 陈章 , 孙光裕 , 方振曼 , 周培培 , 丛京生 :
咖啡因:深度卷积神经网络的统一表示和加速。 ACM TUR-C公司 2023 : 47-48 [第17条] 金明庄 , 杨卓平 , 周培培 :
基于ACAP的高性能、低功耗矩阵乘法设计:从架构、设计挑战和DSE角度。 数模转换器 2023 : 1-6 [第16条] 金明庄 , 白彪 , 叶汉晨 , 杨卓平 , 杜玉波 , 杰克·洛 , 克里斯托夫·德诺夫 , 斯蒂芬·纽恩多弗 , 亚历克斯·K·琼斯 , 胡静桐 , 陈德铭(Deming Chen) , 丛京生 , 周培培 :
CHARM:在通用ACAP架构上为矩阵乘法构造异构加速比。 FPGA(现场可编程门阵列) 2023 : 153-164 [第15条] 杨卓平 , 金明庄 , 贾其寅 , 存西峪 , 亚历克斯·K·琼斯 , 周培培 :
目的:在异构可重构计算平台Versal ACAP上加速任意精度整数乘法。 国际计算机辅助设计协会 2023 : 1-9 [第14条] 周培培 , 金明庄 , 斯蒂芬·卡洪 , 岳堂 , 杨卓平 , 陈兴珍 , Yiyu Shi公司 , 胡静桐 , 亚历克斯·K·琼斯 :
刷新FPGA:可持续FPGA芯片架构。 IGSC公司 2023 : 1-3 [i12] 金明庄 , 白彪 , 叶汉晨 , 杨卓平 , 杜玉波 , 杰克·洛 , 克里斯托夫·德诺夫 , 斯蒂芬·纽恩多弗 , 亚历克斯·K·琼斯 , 胡静桐 , 陈德铭(Deming Chen) , 丛京生 , 周培培 :
CHARM:在通用ACAP架构上为矩阵乘法构造异构加速器。 CoRR公司 abs/2301.02359 ( 2023 ) [i11] 金明庄 , 杨卓平 , 周培培 :
AutoMM:异构可编程系统芯片上的高能效多数据型矩阵乘法设计。 CoRR公司 腹肌/2305.18698 ( 2023 ) [i10] 杨卓平 , 金明庄 , 贾其寅 , 存西峪 , 亚历克斯·K·琼斯 , 周培培 :
目的:在异构可重构计算平台Versal ACAP上加速任意精度整数乘法。 CoRR公司 abs/2309.12275 ( 2023 ) [第九章] 秦瑞阳 , Jun Xia先生 , 郑戈佳 , 孟江 , 艾哈迈德·阿巴斯 , 周培培 , 胡静桐 , Yiyu Shi公司 :
通过自我监督的数据选择和合成实现设备上的大型语言模型个性化。 CoRR公司 abs/2311.12275 ( 2023 ) [i8] 杨卓平 , 时新记 , 陈兴珍 , 金明庄 , 张伟峰 , 达尔米什·贾尼 , 周培培 :
通过异构芯片实现大规模计算的挑战和机遇。 CoRR公司 abs/2311.16417 ( 2023 ) [i7] 周培培 , 金明庄 , 斯蒂芬·卡洪 , 岳堂 , 杨卓平 , 陈兴珍 , Yiyu Shi公司 , 胡静桐 , 亚历克斯·K·琼斯 :
刷新FPGA:可持续FPGA芯片架构。 CoRR公司 abs/2312.02991 ( 2023 ) 2022 【j4】 岳堂 , 吴亚文 , 周培培 , 胡静桐 :
从视频流的设备上学习实现弱监督的时间动作定位。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 41 ( 11 ) : 3910-3921 ( 2022 ) [j3] 岳堂 , 张欣怡 , 周培培 , 胡静桐 :
EF-Train:通过在线适应或个性化的数据重塑,在FPGA上实现高效的设备CNN培训。 ACM事务处理。 设计自动。 选举人。 系统。 27 ( 5 ) : 49:1-49:36 ( 2022 ) [第13条] 张欣怡 , 丛浩 , 周培培 , 亚历克斯·K·琼斯 , 胡静桐 :
H2H:具有计算和通信意识的异构模型到异构系统的映射。 数模转换器 2022 : 601-606 [i6] 岳堂 , 张欣怡 , 周培培 , 胡静桐 :
EF-Train:通过在线改编或个性化的数据重塑,在FPGA上实现高效的设备CNN培训。 CoRR公司 腹肌/2202.10935 ( 2022 ) [i5] 张欣怡 , 丛浩 , 周培培 , 亚历克斯·K·琼斯 , 胡静桐 :
H2H:具有计算和通信意识的异构模型到异构系统的映射。 CoRR公司 abs/2204.13852 ( 2022 ) [i4] 塞巴斯蒂安·奥利维尔 , 胜利(Sheng Li) , 岳堂 , 查亚尼卡·乔杜里 , 周培培 , 唐旭龙 , 胡静桐 , 亚历克斯·K·琼斯 :
边缘的可持续人工智能处理。 CoRR公司 abs/2207.01209 ( 2022 ) [i3] 岳堂 , 吴亚文 , 周培培 , 胡静桐 :
通过视频流的在线学习实现弱监督的时间动作定位。 CoRR公司 abs/2208.12673 ( 2022 ) 2021 [注2] 张欣怡 , 吴亚文 , 周培培 , 唐旭龙 , 胡静桐 :
FPGA器件注意力机制的算法-硬件协同设计。 ACM事务处理。 嵌入。 计算。 系统。 20 ( 5秒 ) : 71:1-71:24 ( 2021 ) [第12条] 周培培 , 嘉义盛 , 科迪·郝宇 , 彭伟 , 王杰(音译) , 狄武 , 丛京生 :
MOCHA:带加速器的异构云中的多节点成本优化。 FPGA(现场可编程门阵列) 2021 : 273-279 2020 [第11条] 劳伟堂 , 方振曼 , 王杰(音译) , 周培培 , 毛昌Frank Chang , 丛京生 :
基因组分析工具包中BQSR加速算法-硬件协同设计。 催化裂化装置 2020 : 157-166
2010 – 2019
2019 【b1】 周培培 :
定制计算的建模和优化:性能、能源和成本视角。 美国洛杉矶加利福尼亚大学, 2019 [j1] 陈章 , 孙光裕 , 方振曼 , 周培培 , 潘培晨 , 丛京生 :
咖啡因:深度卷积神经网络的统一表示和加速。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 38 ( 11 ) : 2072-2085 ( 2019 ) 2018 [第10条] 阮振元 , 同和 , 李伯杰 , 周培培 , 丛京生 :
ST-Accel:FPGA上流应用程序的高级编程平台。 催化裂化装置 2018 : 9-16 【c9】 丛京生 , 彭伟 , 科迪·郝宇 , 周培培 :
Latte:用于高级合成的局部感知转换。 催化裂化装置 2018 : 125-128 【c8】 玉泽池 , 周培培 , 丛京生 :
具有数据重用和精细并行性的模具计算的最佳微结构:(仅抽象)。 FPGA(现场可编程门阵列) 2018 : 286 【c7】 玉泽池 , 丛京生 , 彭伟 , 周培培 :
SODA:具有优化数据流架构的模具。 国际计算机辅助设计协会 2018 : 116 【c6】 周培培 , 阮振元 , 方振曼 , 梅根·尚德 , 大卫·罗赞 , 丛京生 :
Doppio:内存计算框架的I/O感知性能分析、建模和优化。 ISPASS公司 2018 : 22-32 [i2] 丛京生 , 方振曼 , 于晨浩 , 彭伟 , 科迪·郝宇 , 陈章 , 周培培 :
全力以赴的FPGA编程:几步就能走得更远。 CoRR公司 腹肌/1807.01340 ( 2018 ) 2017 【c5】 丛京生 , 彭伟 , 科迪·郝宇 , 周培培 :
HLS芯片内存重组带宽优化。 数模转换器 2017 : 43:1-43:6 2016 【c4】 周培培 , 现代公园 , 方振曼 , 丛京生 , 安德烈·德洪 :
全流水线的能效:矩阵乘法的案例研究。 催化裂化装置 2016 : 172-175 【c3】 陈玉亭 , 丛京生 , 方振曼 , 周培培 :
ARAPrototype:实现加速器丰富体系结构的快速原型和评估(仅抽象)。 FPGA(现场可编程门阵列) 2016 : 281 【c2】 陈章 , 方振曼 , 周培培 , 潘培晨 , 丛京生 :
咖啡因:用于深度卷积神经网络的统一表示和加速。 国际计算机辅助设计协会 2016 : 12:1-12:8 [i1] 陈玉亭 , 丛京生 , 方振曼 , 萧炳君 , 周培培 :
ARAPrototype:实现加速器丰富架构的快速原型和评估。 CoRR公司 abs/1610.09761 ( 2016 ) 2014 【c1】 丛京生 , Hui Huang(黄慧) , 赤原马 , 萧炳君 , 周培培 :
CGRA的全流水线和动态可组合体系结构。 催化裂化装置 2014 : 9-16