郭平龙
人员信息
优化列表
2020年–今天
2022 [公元34年] 甄正 , 宣达·杨 , 赵鹏展 , 郭平龙 , 朱凯(Kai Zhu) , 朱飞文 , 赵文义 , 刘晓勇 , 杨军(Jun Yang) , 冀东寨 , 宋帅文 , 魏琳 :
AStitch:为现代SIMT体系结构上的内存密集型ML训练和推理提供一个新的多维优化空间。 ASPLOS公司 2022 : 359-373 [公元33年] 罗子跃 , 易晓东 , 郭平龙 , 石庆凡 , 川武 , 杨军(Jun Yang) , 魏琳 :
快速分布式DNN培训的高效管道规划。 信息通信 2022 : 340-349 [i11] 紫月罗 , 易晓东 , 郭平龙 , 石庆凡 , 川武 , 杨军(Jun Yang) , 魏琳 :
快速分布式DNN培训的高效管道规划。 CoRR公司 abs/2204.10562 ( 2022 ) 2021 [公元32年] 石庆凡 , 易容 , 陈萌 , 曹宗岩 , 王思玉(Siyu Wang) , 甄正 , 川武 , 郭平龙 , 杨军(Jun Yang) , 夏立雪 , 蓝松雕 , 刘晓勇 , 魏琳 :
DAPPLE:用于训练大型模型的流水线数据并行方法。 PPoPP(PPoPP) 2021 : 431-445 2020 【j4】 贾贺 , 杜长英 , 傅振庄 , 辛茵 , 清河 , 郭平龙 :
用于多视图分类和回归的在线贝叶斯最大边缘子空间学习。 机器。 学习。 109 ( 2 ) : 219-249 ( 2020 ) [公元31年] 易晓东 , 张世伟(Shiwei Zhang) , 紫月罗 , 郭平龙 , 蓝松雕 , 川武 , 甄正 , 杨军(Jun Yang) , 魏琳 :
优化异构GPU集群中的分布式训练部署。 CoNEXT公司 2020 : 93-107 [公元30年] 易晓东 , 紫月罗 , 陈萌 , 王梦迪 , 郭平龙 , 川武 , 杨军(Jun Yang) , 魏琳 :
在多个GPU上快速训练深度学习模型。 中间件 2020 : 105-118 [i10] 石庆凡 , 易容 , 陈萌 , 曹宗岩 , 王思玉(Siyu Wang) , 甄正 , 吴川 , 郭平龙 , 杨军(Jun Yang) , 李雪霞 , 蓝松雕 , 刘晓勇 , 魏琳 :
DAPPLE:用于训练大型模型的流水线数据并行方法。 CoRR公司 abs/2007.01045 ( 2020 ) [第九章] 王思玉(Siyu Wang) , 易容 , 石庆凡 , 甄正 , 蓝松雕 , 郭平龙 , 杨军(Jun Yang) , 刘晓勇 , 魏琳 :
Auto-MAP:用于探索DNN工作负载的分布式执行计划的DQN框架。 CoRR公司 abs/2007.04069 ( 2020 ) [i8] 郑珍 , 赵鹏展 , 郭平龙 , 朱飞文 , 朱凯(Kai Zhu) , 赵文义 , 蓝松雕 , 杨军(Jun Yang) , 魏琳 :
融合缝合:提高记忆密集型计算的深度学习工作量。 CoRR公司 abs/2009.10924 ( 2020 )
2010 – 2019
2019 [公元29年] 王梦迪 , 陈萌 , 郭平龙 , 川武 , 杨军(Jun Yang) , 魏琳 , 杨庆佳 :
描述阿里巴巴PAI上的深度学习培训工作量。 IISWC公司 2019 : 189-202 [i7] 杜长英 , 傅振庄 , 贾贺 , 清河 , 郭平龙 :
通过贝叶斯非参数主题建模超越预定义标签空间学习。 CoRR公司 abs/1910.04420 ( 2019 ) [i6] 杜长英 , 贾贺 , 常德都 , 傅振庄 , 清河 , 郭平龙 :
非线性最大边缘多视图学习的高效自适应核化。 CoRR公司 abs/1910.05250 ( 2019 ) [i5] 王梦迪 , 陈萌 , 郭平龙 , 川武 , 杨军(Jun Yang) , 魏琳 , 杨庆佳 :
描述阿里巴巴PAI上的深度学习培训工作量。 CoRR公司 abs/1910.05930 ( 2019 ) [i4] 郭平龙 , 杨军(Jun Yang) , 魏琳 :
融合缝合:提高DL工作负载的内存密集型计算的执行效率。 CoRR公司 abs/1911.11576 ( 2019 ) 2018 [i3] 郭平龙 , 杨军(Jun Yang) , 朱凯(Kai Zhu) , 魏琳 :
融合缝合:GPU上张量流计算的深度融合和代码生成。 CoRR公司 abs/1811.05213 ( 2018 ) 2017 [公元28年] 沈晓宇 , 苏慧(Hui Su) , 李彦然 , 李文杰 , 树子牛 , 杨钊 , 爱泽昭子 , 郭平龙 :
对话框生成的条件变量框架。 ACL(2) 2017 : 504-509 [公元27年] 贾贺 , 杜长英 , 常德都 , 傅振庄 , 清河 , 郭平龙 :
基于自适应核的非线性最大裕度多视图学习。 国际JCAI 2017 : 1830-1836 [i2] 沈晓宇 , 苏慧(Hui Su) , 李彦然 , 李文杰 , 树子牛 , 杨钊 , 爱泽明子 , 郭平龙 :
对话框生成的条件变量框架。 CoRR公司 abs/1705.00316 ( 2017 ) 2016 [j3] 马文静(Wenjing Ma) , Kan Gao(坎高) , 郭平龙 :
用于模板代码的高度优化代码生成以及GPU的计算重用。 J.计算。 科学。 Technol公司。 31 ( 6 ) : 1262-1274 ( 2016 ) [公元26年] 贾贺 , 杜长英 , 傅振庄 , 辛茵 , 清河 , 郭平龙 :
在线贝叶斯最大边际子空间多视图学习。 国际JCAI 2016 : 1555-1561 [公元25年] 斯奇·登 , Kan Gao(坎高) , 杜长英 , 马文静(Wenjing Ma) , 郭平龙 , 李玉成 :
在线变分贝叶斯支持向量回归。 国际JCNN 2016 : 3950-3957 [公元24年] 马文静(Wenjing Ma) , 曹良良 , 雷雨 , 郭平龙 , 李玉成 :
GPU-FV:实时Fisher向量及其在视频监控中的应用。 国际资本市场规则 2016 : 39-46 [c23] 常德都 , 杜长英 , 山店哲 , 阿里·罗 , 清河 , 郭平龙 :
支持向量学习机的贝叶斯群特征选择。 PAKDD(1) 2016 : 239-252 [公元22年] 杜长英 , 傅振庄 , 贾贺 , 清河 , 郭平龙 :
通过贝叶斯非参数主题建模超越预定义标签空间学习。 ECML/PKDD(1) 2016 : 148-164 【c21】 杜长英 , 常德都 , 郭平龙 , 新晋 , 李玉成 :
高效贝叶斯最大余量多核学习。 ECML/PKDD(1) 2016 : 165-181 [公元20年] 杜长英 , 常德都 , 郭平龙 , 清河 , 李玉成 :
在线贝叶斯多核二分排序。 阿联酋 2016 [第19条] 宁步 , Shuzi牛 , 雷雨 , 马文静(Wenjing Ma) , 郭平龙 :
弥合应用程序名称之间的语义鸿沟:类似移动应用程序推荐的集合矩阵分解。 智慧(2) 2016 : 324-339 [i1] 马文静(Wenjing Ma) , 曹良良 , 雷雨 , 郭平龙 , 李玉成 :
GPU-FV:实时Fisher向量及其在视频监控中的应用。 CoRR公司 腹肌/1604.03498 ( 2016 ) 2015 [第18条] 周成钢 , 乾坤洞 , 马文静(Wenjing Ma) , 郭平龙 , 李涛 :
PE-TLD:用于多目标跟踪的并行扩展跟踪学习检测。 ICA3PP(2) 2015 : 665-677 [第17条] 宁步 , 雷宇 , 马文静(Wenjing Ma) , 杜长英 , 树子牛 , 郭平龙 :
使用转移学习检测类似的移动应用程序。 智能城市 2015 : 856-859 [第16条] 树子牛 , 燕燕兰 , 郭家峰 , 程雪琪 , 雷雨 , 郭平龙 :
众包中排名聚合的列表方法。 WSDM公司 2015 : 253-262 2014 [第15条] 吴振华 , 马文静(Wenjing Ma) , 郭平龙 , 李玉成 , 秋燕汤 , 王忠杰 :
GPU上的高性能二维相位展开。 Conf.计算前沿 2014 : 35:1-35:10 2013 [注2] 李燕 , 张云泉 , 刘益群 , 郭平龙 , 贾海鹏 :
MPFFT:用于OpenCL GPU的自动调整FFT库。 J.计算。 科学。 Technol公司。 28 ( 1 ) : 90-105 ( 2013 ) [第14条] 希巴塔拉·萨德尔丁 , 戴安娜·富兰克林 , 郭平龙 , 夏洛特希尔 , 艾莎·布朗 , 德米特里·B·斯特鲁科夫 , 蒂莫西·舍伍德 , 弗雷德里克·T·冲 :
用于神经分支预测的忆阻器:一项关于严格延迟和书写耐力挑战的案例研究。 Conf.计算前沿 2013 : 26:1-26:10 [第13条] 王伟彦 , 张云泉 , 郭平龙 , 盛恩颜 , 贾海鹏 :
CLSIFT:GPU上尺度不变特征变换的优化研究。 HPCC/EUC公司 2013 : 93-100 [第12条] 盛恩颜 , 郭平龙 , 张云泉 :
StreamScan:用于GPU的快速扫描算法,无需全局屏障同步。 PPoPP(PPoPP) 2013 : 229-238 2012 [第11条] 贾海鹏 , 张云泉 , 郭平龙 , 徐建良 , 盛恩颜 , 李燕 :
GPURoofline:指导GPU性能优化的模型。 欧洲-保时捷 2012 : 920-932 [c10] 贾海鹏 , 张云泉 , 郭平龙 , 盛恩颜 :
用于GPU计算的深入的程序性能调整链。 ICA3PP(1) 2012 : 502-516 2011 【c9】 孙向政 , 张云泉 , 王婷(Ting Wang) , 郭平龙 , 张贤义(Xianyi Zhang) , 李燕 :
CRSD:对角稀疏矩阵的SpMV的特定应用程序自动调整。 Euro-Par(2) 2011 : 316-327 【c8】 李燕 , 张云泉 , 贾海鹏 , 郭平龙 , 王珂(Ke Wang) :
OpenCL GPU上的自动FFT性能调整。 ICPADS公司 2011 : 228-235 2010 【c7】 郭平龙 , 戴安娜·富兰克林 , 苏米特·比斯瓦斯 , 巴勃罗·奥尔蒂斯 , 杰森·奥伯格 , 东瑞风机 , 弗雷德里克·T·冲 :
最小多线程:在多线程处理器中查找和删除冗余指令。 微型的 2010 : 337-348
2000 – 2009
2009 [j1] 东瑞风机 , 南苑 , 张俊超 , 周永斌 , 魏琳 , 宋凤龙 , 叶晓春 , 何晃 , 雷宇 , 郭平龙 , 张浩(Hao Zhang) , 刘雷(Lei Liu) :
龙芯T:一种高效的多核并行程序执行体系结构。 J.计算。 科学。 Technol公司。 24 ( 6 ) : 1061-1073 ( 2009 ) 【c6】 郭平龙 , 东瑞风机 , 张俊超 :
描述和理解多核处理器上工作负载的带宽行为。 欧洲-保时捷 2009 : 110-121 【c5】 郭平龙 , 东瑞风机 , 张俊超 :
在许多核心体系结构上为cilk计算提供体系结构支持。 PPoPP(PPoPP) 2009 : 285-286 2008 【c4】 郭平龙 , 东瑞风机 , 张俊超 , 宋凤龙 , 南苑 , 魏琳 :
多核架构上密集矩阵操作的性能模型。 欧洲-保时捷 2008 : 120-129 【c3】 郭平龙 , 南苑 , 东瑞风机 :
重新审视位置一致性模型:问题、解决方案和前景。 PDCAT公司 2008 : 91-98 2007 【c2】 钱学海 , 何晃 , 张浩(Hao Zhang) , 郭平龙 , 张俊超 , 东瑞风机 :
通用RISC体系结构上浮点堆栈的设计与实现。 产品开发计划 2007 : 238-245 2004 【c1】 陈志刚 , 刘安凤 , 郭平龙 :
一种基于有界二级广播技术的网格资源组织协议。 通用条款 2004 : 472-478