唐旭龙
人员信息
优化列表
![笔记](https://dblp.uni-trier.de/img/note-mark.dark.12x12.png)
2020年–今天
2024 [第52条] 王月琦 , 李冰耀 , 阿默·贾勒尔 , 杨军(Jun Yang) , 唐旭龙 :
GRIT:通过细粒度动态页面放置增强多-GPU性能。 HPCA公司 2024 : 1080-1094 [第51条] 杨凯兴 , 周旭坤 , 唐旭龙 , 冉刁 , 刘红艳 , 何骏 , 赵欣凡 :
BeatDance:一个基于Beat的模型-认知对比学习框架,用于音乐-舞蹈检索。 国际资本市场规则 2024 : 11-19 [公元50年] 杨凯兴 , 唐旭龙 , 冉刁 , 刘红艳 , 何骏 , 赵欣凡 :
舞伴:由音乐驱动的连贯团体舞一代与舞蹈单位。 国际资本市场规则 2024 : 675至683 【i15】 胜利(Sheng Li) , 耿媛 , 吴亚文 , 粤代 , 吴超 , 亚历克斯·K·琼斯 , 胡静桐 , 王彦之(Yanzhi Wang) , 唐旭龙 :
EdgeOL:Edge设备上的高效在线学习。 CoRR公司 abs/2401.16694 ( 2024 ) [第14条] 胜利(Sheng Li) , 耿元 , 粤代 , 张友涛 , 王彦之(Yanzhi Wang) , 唐旭龙 :
SmartFRZ:使用基于注意力的层冻结的高效训练框架。 CoRR公司 abs/2401.16720 ( 2024 ) [i13] 李炳耀 , 王月琦 , 王天宇 , Lieven Eeckhout公司 , 杨军(Jun Yang) , 阿默·贾勒尔 , 唐旭龙 :
通过分入口共享TLB设计提高多实例GPU效率。 CoRR公司 abs/2404.18361 ( 2024 ) 2023 [公元10年] 塞巴斯蒂安·奥利维尔 , 胜利(Sheng Li) , 岳堂 , 斯蒂芬·卡洪 , 瑞安·卡金纳普 , 查亚妮卡·乔杜里 , 周培培 , 唐旭龙 , 胡静桐 , 亚历克斯·K·琼斯 :
边缘的可持续人工智能处理。 IEEE微型 43 ( 1 ) : 19-28 ( 2023 ) [公元49年] 李英恒 , 阿迪蒂亚·帕瓦尔 , 穆罕默德什·阿扎里 , 郭亚南(Yanan Guo) , 张友涛 , 杨军(Jun Yang) , Kaushik Parasuram Seshadreesan公司 , 唐旭龙 :
光子量子处理器上基于协调测量的量子计算。 数模转换器 2023 : 1-6 [公元48年] 李冰耀 , 王月琦 , 唐旭龙 :
编排的调度和分区用于改进GPU中的地址转换。 数模转换器 2023 : 1-6 [公元47年] 梅赫努什·劳菲 , 杨军(Jun Yang) , 唐旭龙 , 张友涛 :
EP-ORAM:混合存储器中环形ORAM的高效NVM友好路径提取。 数模转换器 2023 : 1-6 [公元46年] 梅赫努什·劳菲 , 杨军(Jun Yang) , 唐旭龙 , 张友涛 :
AB-ORAM:在环形ORAM中构造用于空间缩减的可调桶。 HPCA公司 2023 : 361-373 [公元45年] 李冰耀 , 尹杰明 , Anup Holey公司 , 张友涛 , 杨军(Jun Yang) , 唐旭龙 :
Trans-FW:通过远程转发实现多GPU系统中的短路页表漫游。 HPCA公司 2023 : 456-470 [公元44年] 粤代 , 张友涛 , 唐旭龙 :
CEGMA:图形匹配网络的协调弹性图形匹配加速。 HPCA公司 2023 : 584-597 [公元43年] 戴悦 , 唐旭龙 , 张友涛 :
FlexGM:在GPU上加速图形匹配网络的自适应运行时系统。 ICCD公司 2023 : 348-356 [公元42年] 胜利(Sheng Li) , 耿媛 , 粤代 , 张友涛 , 王彦之(Yanzhi Wang) , 唐旭龙 :
SmartFRZ:使用基于注意力的层冻结的高效训练框架。 ICLR公司 2023 [公元41年] 李振刚 , 耿元 , 山内智宏 , 马苏德·扎比希 , 谢燕月 , 董培炎 , 唐旭龙 , 吉川信义 , 德维什·蒂瓦里 , 王彦之(Yanzhi Wang) , 奥利维亚·陈 :
SupeRBNN:使用绝热超导约瑟夫森器件的随机二元神经网络。 微型的 2023 : 584-598 [公元40年] 李冰耀 , 郭亚南(Yanan Guo) , 王月琦 , 阿默·贾勒尔 , 杨军(Jun Yang) , 唐旭龙 :
IDYLL:通过轻量级PTE失效增强多GPU中的页面翻译。 微型的 2023 : 1163-1177 [i12] 李振刚 , 耿元 , 山内智宏 , 马苏德·扎比希 , 谢燕月 , 裴延东 , 唐旭龙 , 吉川信义 , 德维什·蒂瓦里 , 王彦之(Yanzhi Wang) , 奥利维亚·陈 :
SupeRBNN:使用绝热超导约瑟夫森器件的随机二元神经网络。 CoRR公司 abs/2309.12212 ( 2023 ) [i11] 杨凯兴 , 周旭坤 , 唐旭龙 , 冉刁 , 刘红艳 , 何军 , 赵欣凡 :
BeatDance:一个基于Beat的模型-认知对比学习框架,用于音乐-舞蹈检索。 CoRR公司 abs/2310.10300 ( 2023 ) [i10] 阿迪蒂亚·帕瓦尔 , 李英恒 , 泽维莫 , 郭亚南(Yanan Guo) , 张友涛 , 唐旭龙 , 杨军(Jun Yang) :
用于大量子电路评估的集成量子比特重用和电路切割。 CoRR公司 abs/2312.10298 ( 2023 ) [i9] 李英恒 , 阿迪蒂亚·帕瓦尔 , 泽维莫 , 张友涛 , 杨军(Jun Yang) , 唐旭龙 :
基于测量的量子计算中最小化光子团簇状态深度。 CoRR公司 abs/2312.10865 ( 2023 ) 2022 [公元9年] 粤代 , 唐旭龙 , 张友涛 :
图神经网络的有效分段量化。 CCF变速器。 高性能计算。 4 ( 4 ) : 461-473 ( 2022 ) [j8] 耿媛 , 裴延东 , 孙梦舒 , 魏牛 , 李振刚 , 蔡宇轩 , 李彦宇 , 刘军(Jun Liu) , 魏文江 , 薛琳 , 宾仁 , 唐旭龙 , 王彦之(Yanzhi Wang) :
移动或FPGA? 能源效率综合评估和统一优化框架。 ACM事务处理。 嵌入。 计算。 系统。 21 ( 5 ) : 65:1-65:22 ( 2022 ) [j7] 一帆功 , 耿媛 , 郑战 , 魏牛 , 李振刚 , Pu Zhao先生 , 蔡宇轩 , 刘思嘉 , 宾仁 , 薛琳 , 唐旭龙 , 王彦之(Yanzhi Wang) :
实时移动加速最佳DNN修剪方案的自动映射。 ACM事务处理。 设计自动。 选举人。 系统。 27 ( 5 ) : 47:1-47:26 ( 2022 ) [公元39年] 耿媛 , 宋恩昌 , 清津 , 亚历克·卢 , 李彦宇 , 玉树·吴 , 孔正伦 , 谢燕月 , 裴延东 , 秦明海 , 马小龙 , 唐旭龙 , 方振曼 , 王彦之(Yanzhi Wang) :
您已经拥有了:一个使用随机取整的无生成器低精度DNN训练框架。 ECCV(12) 2022 : 34至51 [公元38年] 赵一伦 , 郭亚南(Yanan Guo) , 袁瑶 , 阿曼达·杜米 , 德文·穆尔维 , Shiv Upadhyay先生 , 张友涛 , 肯尼思·乔丹 , 杨军(Jun Yang) , 唐旭龙 :
Q-GPU:使用GPU进行量子电路模拟的优化方法。 HPCA公司 2022 : 726-740 [公元37年] 马赫穆特·坎德米尔 , 唐旭龙 , 贾加迪什·科特拉 , 穆斯塔法·卡拉科伊 :
精细计算和数据布局重组以提高局部性。 国际计算机辅助设计协会 2022 : 5:1-5:9 [公元36年] 杜亚娟 , 刘明阳 , 杨宇奇 , 张明哲 , 唐旭龙 :
通过基于相邻目录表的TLB间共享提高GPU性能。 ICCD公司 2022 : 146-153 [公元35年] 耿媛 , 李彦宇 , 胜利(Sheng Li) , 孔正伦 , 谢尔盖·图利亚科夫 , 唐旭龙 , 王彦之(Yanzhi Wang) , 健仁 :
图层冻结和数据筛选:稀疏训练通用框架的缺失部分。 NeurIPS公司 2022 [公元34年] 李冰耀 , 齐雪 , 耿媛 , 胜利(Sheng Li) , 马小龙 , 王彦之(Yanzhi Wang) , 唐旭龙 :
优化数据布局以训练深度神经网络。 WWW(配套卷) 2022 : 548-554 [i8] 塞巴斯蒂安·奥利维尔 , 胜利(Sheng Li) , 岳堂 , 查亚尼卡·乔杜里 , 周培培 , 唐旭龙 , 胡静桐 , 亚历克斯·K·琼斯 :
边缘的可持续人工智能处理。 CoRR公司 abs/2207.01209 ( 2022 ) [i7] 王振东 , 曾晓明 , 唐旭龙 , 张丹凤 , 兴虎 , 杨虎 :
解密模型提取的拱形提示:统一内存系统中的一种攻击。 CoRR公司 abs/2208.13720 ( 2022 ) [i6] 耿媛 , 李彦宇 , 胜利(Sheng Li) , 孔正伦 , 谢尔盖·图利亚科夫 , 唐旭龙 , 王彦之(Yanzhi Wang) , 健仁 :
图层冻结和数据筛选:稀疏训练通用框架的缺失部分。 CoRR公司 abs/2209.11204 ( 2022 ) 2021 [j6] 唐旭龙 , Mahmut Taylan坎德米尔 , 穆斯塔法·卡拉科伊 :
混搭:重组任务以增强数据本地化。 程序。 ACM测量。 分析。 计算。 系统。 5 ( 2 ) : 20:1-20:24 ( 2021 ) [j5] 张欣怡 , 吴亚文 , 周培培 , 唐旭龙 , 胡静桐 :
FPGA器件注意力机制的算法-硬件协同设计。 ACM事务处理。 嵌入。 计算。 系统。 20 ( 5秒 ) : 71:1-71:24 ( 2021 ) [公元33年] 蔡宇轩 , 李洪佳 , 耿媛 , 魏牛 , 李彦宇 , 唐旭龙 , 宾仁 , 王彦之(Yanzhi Wang) :
YOLObile:通过压缩编译协同设计在移动设备上进行实时对象检测。 AAAI公司 2021 : 955-963年 [公元32年] 蔡宇轩 , 耿媛 , 李洪佳 , 魏牛 , 李彦宇 , 唐旭龙 , 宾仁 , 王彦之(Yanzhi Wang) :
面向移动设备上实时对象检测的压缩编译协同设计框架。 AAAI公司 2021 : 15997-16000 [公元31年] 王振东 , 王汝嘉 , 姜子航 , 唐旭龙 , 尹守义 , 杨虎 :
通过CPU/GPU协同加密实现安全的集成异构平台。 自动转换开关 2021 : 115-120 [公元30年] 徐伟正 , 阿舒托什·帕特奈克 , 耿媛 , 王彦之(Yanzhi Wang) , 张友涛 , 唐旭龙 :
ScaleDN:基于Multi-GPU的数据移动感知DNN培训。 国际计算机辅助设计协会 2021 : 1-9 [公元29年] 余福勋 , 肖恩·布雷 , 狄王 , 龙飞上关 , 唐旭龙 , 刘晨晨 , 向晨 :
GPU上多租户DNN推理的自动运行时感知调度。 国际计算机辅助设计协会 2021 : 1-9 [公元28年] 李炳耀 , 尹杰明 , 张友涛 , 唐旭龙 :
通过共享和溢出感知TLB设计改进多GPU中的地址转换。 微型的 2021 : 1154-1168 [c27] 《世雄经》 , 秦坤宝 , 王培(音译) , 唐旭龙 , 吴定浩 :
描述在SGX环境中运行的AI模型推理应用程序的特征。 北美 2021 : 1-4 [公元26年] 江淮盘 , 张海波 , 唐旭龙 , Vineetha Govindaraj公司 , 杰克·桑普森 , Mahmut Taylan坎德米尔 , 张丹凤 :
Fluid:通过受控依赖关系松弛实现近似并发的框架。 PLDI公司 2021 : 252-267 [公元25年] Mahmut Taylan坎德米尔 , 唐旭龙 , 赵慧(音) , Jihyun Ryoo先生 , 穆斯塔法·卡拉科伊 :
时间上的距离与空间上的距离。 PLDI公司 2021 : 665-680 [公元24年] Mahmut Taylan坎德米尔 , Jihyun Ryoo先生 , 唐旭龙 , 穆斯塔法·卡拉科伊 :
编译器支持近数据计算。 PPoPP(PPoPP) 2021 : 90-104 【c23】 耿媛 , 裴延东 , 孙梦舒 , 魏牛 , 李振刚 , 蔡宇轩 , 刘军(Jun Liu) , 魏文江 , 薛琳 , 任斌 , 唐旭龙 , 王彦之(Yanzhi Wang) :
正在进行的工作:移动还是FPGA? 能源效率综合评估和统一优化框架。 RTAS公司 2021 : 493-496 [公元22年] 唐旭龙 , Mahmut Taylan坎德米尔 , 穆斯塔法·卡拉科伊 :
混搭:重组任务以增强数据本地化。 SIGMETRICS(摘要) 2021 : 47-48 【c21】 徐伟正 , 张友涛 , 唐旭龙 :
在GPU上并行DNN培训:挑战与机遇。 WWW(配套卷) 2021 : 174-178 [i5] 一帆功 , 耿媛 , 郑战 , 魏牛 , 李振刚 , Pu Zhao先生 , 蔡宇轩 , 刘思嘉 , 宾仁 , 薛琳 , 唐旭龙 , 王彦之(Yanzhi Wang) :
实时移动加速最佳DNN修剪方案的自动映射。 CoRR公司 腹肌/2111.11581 ( 2021 ) [i4] 余福勋 , 狄王 , 龙飞上关 , 张敏佳 , 唐旭龙 , 刘晨晨 , 向晨 :
大规模深度学习服务系统优化综述:挑战与机遇。 CoRR公司 abs/2111.14247 ( 2021 ) [i3] 余福勋 , 肖恩·布雷 , 狄王 , 龙飞上关 , 唐旭龙 , 刘晨晨 , 向晨 :
GPU上多租户DNN推理的自动运行时感知调度。 CoRR公司 abs/2111.14255 ( 2021 ) 2020 【j4】 王振东 , 姜子航 , 王震(音) , 唐旭龙 , 刘聪(音) , 首义音 , 杨虎 :
为集成CPU/GPU异构平台启用延迟感知数据初始化。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 39 ( 11 ) : 3433-3444 ( 2020 ) [公元20年] 唐旭龙 , Ziyu Zhang(张子玉) , 徐伟正 , Mahmut Taylan坎德米尔 , 拉米·梅勒姆 , 杨军(Jun Yang) :
通过压缩增强吞吐量处理器中的地址转换。 PACT公司 2020 : 191-204 [i2] 郭沙沙 , 莲花区 , 王磊(Lei Wang) , 唐旭龙 , 朔天 , 李世明 , 徐伟霞 :
探索提高液态机器性能的输入模式。 CoRR公司 abs/2004.02540 ( 2020 ) [i1] 蔡宇轩 , 李洪佳 , 耿媛 , 魏牛 , 李彦宇 , 唐旭龙 , 宾仁 , 王彦之(Yanzhi Wang) :
YOLObile:通过压缩编译协同设计在移动设备上进行实时对象检测。 CoRR公司 abs/2009.05697 ( 2020 )
2010 – 2019
2019 [j3] 穆斯塔法·卡拉科伊 , 奥尔汉·基斯拉尔 , 唐旭龙 , Mahmut Taylan坎德米尔 , Meenakshi Arunachalam公司 :
架构软件近似计算。 程序。 ACM测量。 分析。 计算。 系统。 三 ( 2 ) : 38:1-38:24 ( 2019 ) [第19条] Jihyun Ryoo先生 , 梦然扇 , 唐旭龙 , 江淮盘 , Meena Arunachalam公司 , 莎拉达·纳维恩 , 马赫穆特·坎德米尔 :
深度神经网络应用的架构中心瓶颈分析。 高性能计算机 2019 : 205-214 [第18条] 阿舒托什·帕特奈克 , 唐旭龙 , Onur Kayiran公司 , Adwait慢跑 , 阿西特·米什拉 , 马赫穆特·坎德米尔 , 阿南德·西瓦苏布拉马尼亚姆 , 契塔·R·达斯 :
GPU架构中的机会主义计算。 国际标准协会 2019 : 210-223 [c17] 唐旭龙 , Mahmut Taylan坎德米尔 , 穆斯塔法·卡拉科伊 , Meenakshi Arunachalam公司 :
共同优化内存级并行和缓存级并行。 PLDI公司 2019 : 935-949 [第16条] 穆斯塔法·卡拉科伊 , 奥尔汉·基斯拉尔 , 唐旭龙 , Mahmut Taylan坎德米尔 , Meenakshi Arunachalam公司 :
架构软件近似计算。 SIGMETRICS(摘要) 2019 : 23-24 [第15条] 唐旭龙 , 阿舒托什·帕特奈克 , Onur Kayiran公司 , Adwait慢跑 , Mahmut Taylan坎德米尔 , 契塔·R·达斯 :
在GPU的动态并行中量化数据位置。 SIGMETRICS(摘要) 2019 : 25-26 [第14条] 唐旭龙 , Mahmut Taylan坎德米尔 , 赵慧(音) , Myoungsoo Jung先生 , 穆斯塔法·卡拉科伊 :
使用近距离数据进行计算。 SIGMETRICS(摘要) 2019 : 27-28 2018 [注2] 唐旭龙 , 阿舒托什·帕特奈克 , Onur Kayiran公司 , Adwait慢跑 , Mahmut Taylan坎德米尔 , 契塔·R·达斯 :
在GPU的动态并行中量化数据位置。 程序。 ACM测量。 分析。 计算。 系统。 2 ( 三 ) : 39:1-39:24 ( 2018 ) [j1] 唐旭龙 , Mahmut Taylan坎德米尔 , 赵慧(音) , Myoungsoo Jung先生 , 穆斯塔法·卡拉科伊 :
使用近距离数据进行计算。 程序。 ACM测量。 分析。 计算。 系统。 2 ( 三 ) : 42:1-42:30 ( 2018 ) [第13条] Jihyun Ryoo先生 , 奥尔汉·基斯拉尔 , 唐旭龙 , 马赫穆特·坎德米尔 :
在Manycores上量化和优化数据访问并行性。 马斯科茨 2018 : 131-144 [第12条] 奥尔汉·基斯拉尔 , 贾加迪什·科特拉 , 唐旭龙 , Mahmut Taylan坎德米尔 , Myoungsoo Jung先生 :
利用物理位置信息增强计算到核心的分配。 PLDI公司 2018 : 312-327 [第11条] 苏拉吉·普图尔 , 唐旭龙 , 约瑟夫·格罗斯 , 布拉德福德·M·贝克曼 :
GPU中的超额订阅命令队列。 GPGPU@PPoPP 2018 : 50-60 2017 [第10条] 奥尔汉·基斯拉尔 , 贾加迪什·科特拉 , 唐旭龙 , Mahmut Taylan坎德米尔 , Myoungsoo Jung先生 :
海报:多核处理器的位置软件计算映射。 PACT公司 2017 : 138-139 【c9】 唐旭龙 , 阿舒托什·帕特奈克 , 江淮盘 , Onur Kayiran公司 , Adwait慢跑 , Sreepathi Pai公司 , 穆罕默德·阿塞姆·易卜拉欣 , 马赫穆特·坎德米尔 , 契塔·R·达斯 :
GPU中动态并行的受控内核启动。 HPCA公司 2017 : 649-660 【c8】 阿克巴尔·沙里菲 , 魏丁 , 戴安娜·古特曼 , 赵慧(音) , 唐旭龙 , 马赫穆特·坎德米尔 , 契塔·R·达斯 :
DEMM:多核存储器的动态节能机制。 马斯科茨 2017 : 210至220 【c7】 唐旭龙 , 奥尔汉·基斯拉尔 , 马赫穆特·坎德米尔 , 穆斯塔法·卡拉科伊 :
支持数据移动的计算分区。 微型的 2017 : 730-744 2016 【c6】 Onur Kayiran公司 , Adwait慢跑 , 阿舒托什·帕特奈克 , 拉查塔·奥萨瓦隆尼伦 , 唐旭龙 , 马赫穆特·坎德米尔 , 加布里埃尔·H·卢 , 奥努尔·穆特卢 , 契塔·R·达斯 :
μC状态:细粒度GPU数据路径电源管理。 PACT公司 2016 : 17-30 【c5】 阿舒托什·帕特奈克 , 唐旭龙 , Adwait慢跑 , Onur Kayiran公司 , 阿西特·米什拉 , 马赫穆特·坎德米尔 , Onur Mutlu公司 , 契塔·R·达斯 :
具有内存处理功能的GPU体系结构的调度技术。 PACT公司 2016 : 31-44 【c4】 唐旭龙 , 马赫穆特·坎德米尔 , 普拉文·叶德拉帕利 , 贾加迪什·科特拉 :
改进非常规应用程序的银行级并行性。 微型的 2016 : 57:1-57:12 2015 [c3] 魏丁 , 唐旭龙 , 马赫穆特·坎德米尔 , 张元瑞 , 埃姆雷·库尔塞伊 :
优化多核中的片外访问。 PLDI公司 2015 : 131-142 【c2】 马赫穆特·坎德米尔 , 赵慧(音) , 唐旭龙 , 穆斯塔法·卡拉科伊 :
内存行重用距离及其在优化应用程序性能中的作用。 SIGMETRICS公司 2015 : 137-149 2012 【c1】 顾刘 , 洪安 , 韩文亭 , 李小强 , 陶孙 , 周伟 , 魏学超 , 唐旭龙 :
FlexBFS:在GPU上实现宽度优先搜索的并行软件。 PPoPP(PPoPP) 2012 : 279-280
合著者索引
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)