帅车
人员信息
其他同名人员
Shuai Chen(帅晨) — 消歧页 陈帅民 陈帅飞 陈帅军 陈帅余 陈帅政 Shuai Chen(帅晨) 0001 -北京大学,机器感知重点实验室,中国北京 帅成 李帅成 (又名:李帅成、李帅成) — 消歧页 李帅成 0001 (又名:Shuai Cheng Li 0001 ) — 香港九龙香港城市大学 (还有3个以上)
优化列表
2020年–今天
2023 [i3] 姚哲伟 , 雷扎·亚兹达尼·阿米纳巴迪 , Olatunji Ruwase公司 , Samyam Rajbhandari先生 , 吴晓霞 , 阿马尔·艾哈迈德·阿旺 , 杰夫·拉斯利 , 张敏佳 , 李从龙 , 康纳·霍姆斯 , 周忠珠 , 迈克尔·怀亚特 , 莫莉·史密斯 , 列夫·库里连科 , 合阳琴 , 田中将大 , 帅车 , 宋帅文 , 何玉雄 :
DeepSpeed-Chat:轻松、快速、经济实惠的RLHF训练,适用于各种规模的ChatGPT-like模型。 CoRR公司 abs/2308.01320 ( 2023 ) 2022 [j5] 殷洪旭 , 陈国洋(音) , 李英敏 , 帅车 , 张伟峰 , 尼拉杰·K·贾 :
通过硬件引导的增长和删减范式实现高效执行的LSTM。 IEEE传输。 Emerg.顶部。 计算。 10 ( 4 ) : 1799-1809 ( 2022 ) 2021 【j4】 叶雨 , 李英敏 , 帅车 , 尼拉杰·K·贾 , 张伟峰 :
用于高效DNN加速器体系结构的软件定义设计空间探索。 IEEE传输。 计算机 70 ( 1 ) : 45-56 ( 2021 ) 2020 [公元25年] 童耕 , 李安(Ang Li) , 石润斌 , 吴春树 , 王天奇 , 李燕飞 , 普亚哈吉 , 安东尼诺·图米奥 , 帅车 , 史蒂文·莱因哈特 , 马丁·赫伯特 :
AWB-GCN:具有运行时工作负载平衡的图卷积网络加速器。 微型的 2020 : 922-936 [公元24年] 比塔·达维什·鲁哈尼 , 主任卢敏道先生 , 李奇·赵(Ritchie Zhao) , 刘明 , 杰里米·福尔斯 , 卡林·奥夫查罗夫 , 安娜·维诺格拉德斯基 , 萨拉·马森吉尔 , 利塔·杨 , 雷·比特纳 , 亚历山德罗·福林 , 朱海山 , 塔西克·纳 , Prerak Patel公司 , 帅车 , 乐昌科帕卡 , 夏松 , Subhojit Som公司 , 考斯塔夫·达斯 , Saurabh Tiwary公司 , 史蒂文·莱因哈特 , Sitaram Lanka公司 , 埃里克·S·钟 , 道格汉堡 :
使用Microsoft浮点在云级别推动窄精度推理的极限。 NeurIPS公司 2020
2010 – 2019
2019 【c23】 帅车 , 尹杰明 :
诺斯普:异构内存和处理器系统中的分治编程。 IPDPS公司 2019 : 335-344 [i2] 殷洪旭 , 陈国洋(音) , 李英敏 , 帅车 , 张伟峰 , 尼拉杰·K·贾 :
针对紧凑、准确、执行效率高的LSTM的硬件引导共生训练。 CoRR公司 abs/1901.10997 ( 2019 ) [i1] 叶雨 , 李英敏 , 帅车 , 尼拉杰·K·贾 , 张伟峰 :
高效AI加速器架构的软件定义设计空间探索。 CoRR公司 abs/1903.07676 ( 2019 ) 2017 [j3] 帅车 , 布拉德福德·M·贝克曼 , 史蒂文·莱因哈特 :
用线性代数构建块编程GPGPU图形应用程序。 国际J并行程序。 45 ( 三 ) : 657-679 ( 2017 ) [公元22年] 尼古拉斯·马来亚 , 帅车 , 约瑟夫·格里塔斯 , 勒内·范·奥斯特罗姆 , 迈克尔·舒尔特 :
使用GPU加速矩阵处理。 ARITH公司 2017 : 139-141 【c21】 帅车 , 马克·奥尔 , 乔纳森·加迈耶 :
共享虚拟内存异构环境中的工作窃取:具有中间集中性的案例研究。 Conf.计算前沿 2017 : 164-173 [公元20年] 侯开禧 , 吴俊峰 , 帅车 :
多核和多核处理器上稀疏矩阵向量(SpMV)乘法并行化的自动调整策略。 IPDPS研讨会 2017 : 713-722 [第19条] 马克·奥尔 , 帅车 , 布拉德福德·M·贝克曼 , 马克·奥斯金 , 史蒂文·莱因哈特 , 大卫·A·伍德 :
Gravel:由GPU发起的细粒度网络消息。 联合国安全理事会 2017 : 23 2016 [第18条] 帅车 , 马克·奥尔 , 格雷戈里·罗杰斯 , 乔纳森·加迈耶 :
启用HSA的系统中的中间中心。 HPGP@HPDC 2016 : 35-38 [第17条] 帅车 , 阿尔卡普拉瓦·巴苏 , 乔纳森·加迈耶 :
用异构内存和异构处理器编程系统的挑战:程序员的观点。 MEMSYS公司 2016 : 99-103 [第16条] 阿尔卡普拉瓦·巴苏 , 苏拉吉·普图尔 , 帅车 , 布拉德福德·M·贝克曼 :
异构处理器的软件辅助硬件缓存一致性。 MEMSYS公司 2016 : 279-288 [第15条] 苏拉吉·普图尔 , 阿什温·M·阿吉 , 帅车 , 玛雅人达加 , 魏武 , 布拉德福德·M·贝克曼 , 格雷戈里·罗杰斯 :
利用异构系统体系结构实现有向无环图。 GPGPU@PPoPP 2016 : 53-62 2015 [第14条] 马克·奥尔 , 帅车 , 艾斯·伊尔马泽 , 布拉德福德·M·贝克曼 , 马克·D·希尔 , 大卫·A·伍德 :
使用远程作用域提升进行同步。 ASPLOS公司 2015 : 73-86 [第13条] 帅车 , 格雷戈里·罗杰斯 , 布拉德福德·M·贝克曼 , 史蒂文·莱因哈特 :
GPU上的图形着色和一些改善负载不平衡的技术。 IPDPS研讨会 2015 : 610-617 2014 [注2] 帅车 , 凯文·斯卡德隆 :
BenchFriend:关联GPU基准测试的性能。 国际期刊高性能计算。 申请。 28 ( 2 ) : 238-250 ( 2014 ) [第12条] 布莱克·赫奇曼 , 帅车 , 德里克·豪尔 , 田莹莹 , 布拉德福德·M·贝克曼 , 马克·D·希尔 , 史蒂文·莱因哈特 , 大卫·A·伍德 :
快速发布:在GPU上发布一致性的面向吞吐量的方法。 HPCA公司 2014 : 189-200 [第11条] 帅车 :
GasCL:GPU的以顶点为中心的图形模型。 高性能电子控制器 2014 : 1-6 [第10条] 帅车 , 布拉德福德·M·贝克曼 , 史蒂文·莱因哈特 :
BelRed:使用软件构建块构建GPGPU图形应用程序。 高性能电子控制器 2014 : 1-6 【c9】 帅车 , 孟嘉元 , 凯文·斯卡德隆 :
Dymaxion++:一种基于方向的API,用于优化异构系统的数据布局和内存映射。 IPDPS研讨会 2014 : 916-924年 【c8】 吉多·朱克兰 , 威廉·C·布兰特利 , 苏尼塔·钱德拉塞卡兰 , 芭芭拉·查普曼 , 帅车 , 马修·科尔格罗夫 , 惠玉峰 , 亚历山大·格兰德 , 罗伯特·亨舍尔 , 文美·W·Hwu , 李惠安 , 马蒂亚斯·穆勒 , 沃尔夫冈·纳格尔 , 马克西姆·帕米诺夫 , 帕维尔·谢尔普金 , 凯文·斯卡德隆 , 约翰·斯特拉顿 , 阿列克谢·蒂托夫 , 王珂(Ke Wang) , G.Matthijs van Waveren先生 , 布莱恩·惠特尼 , 桑德拉·维恩克 , 徐仁干 , 卡利安·库马兰 :
SPEC ACCEL:用于测量硬件加速器性能的标准应用程序套件。 PMBS@SC 2014 : 46-67 2013 【c7】 迈克尔·博伊尔 , 凯文·斯卡德隆 , 帅车 , 努万·贾亚塞纳 :
变化世界中的负载平衡:处理异构性和性能可变性。 Conf.计算前沿 2013 : 21:1-21:10 【c6】 帅车 , 布拉德福德·M·贝克曼 , 史蒂文·莱因哈特 , 凯文·斯卡德隆 :
Pannotia:了解不规则GPGPU图形应用程序。 IISWC公司 2013 : 185-195 2011 【c5】 威姆·海尔曼 , 特雷弗·E·卡尔森 , 帅车 , 凯文·斯卡德隆 , Lieven Eeckhout公司 :
使用循环堆栈了解多线程工作负载中的伸缩瓶颈。 IISWC公司 2011 : 38-49 【c4】 帅车 , 杰里米·西弗 , 凯文·斯卡德隆 :
Dymaxion:为异构系统优化内存访问模式。 联合国安全理事会 2011 : 13:1-13:11 2010 【c3】 帅车 , 杰里米·西弗 , 迈克尔·博伊尔 , 卢卡斯·扎法林(Lukasz G.Szafaryn) , 王亮 , 凯文·斯卡德隆 :
Rodinia基准套件的特征描述,并与当代CMP工作负载进行比较。 IISWC公司 2010 : 1-11