陶唐 0001
人员信息
unicode名称: 唐滔 从属关系(2011年博士): 中国长沙国防科技大学计算机学院
其他同名人员
优化列表
2020年–今天
2024 [公元17年] 陶唐 , 陆凯 , 林鹏 , 崔英波 , 方建斌 , Chun Huang先生 , 王瑞波 , 杨灿群 , 郭一飞 :
SNCL:用于混合计算阵列的超节点OpenCL实现。 J.超级计算机。 80 ( 7 ) : 9471-9493 ( 2024 ) 2023 [公元16年] 方建斌 , 张鹏(音译) , Chun Huang先生 , 陶唐 , 陆凯 , 王瑞波 , 郑旺(音) :
使用异构线程模型编程裸机加速器:Matrix-3000的案例研究。 前沿信息技术。 电子。 工程师。 24 ( 4 ) : 509-520 ( 2023 ) [公元31年] 王鹏宇 , 杨伟玲 , 方建斌 , 德尊侗族 , Chun Huang先生 , 张鹏(音译) , 陶唐 , 郑旺(音) :
在ARM多核上优化直接卷积。 联合国安全理事会 2023 : 70:1-70:13 2022 [公元15年] 陆凯 , 王耀华 , 杨果(Yang Guo) , Chun Huang先生 , 刘盛(Sheng Liu) , 王瑞波 , 方建斌 , 陶唐 , 陈兆云 , 刘碧薇 , 钟刘 , 袁武雷 , 孙海燕 :
MT-3000:用于HPC的异构多区域处理器。 CCF变速器。 高性能计算。 4 ( 2 ) : 150-164 ( 2022 ) [i6] 方建斌 , 张鹏(音译) , Chun Huang先生 , 陶唐 , 陆凯 , 王瑞波 , 郑旺(音) :
使用异构线程模型编程裸机加速器:Matrix-3000的案例研究。 CoRR公司 abs/2210.12230 ( 2022 ) 2021 [公元14年] 崔英波 , 王子航 , 约翰内斯·科斯特 , 廖祥科 , 彭少良 , 陶唐 , Chun Huang先生 , 杨灿群 :
VISPR在线:一种基于网络的交互式工具,用于可视化CRISPR筛查实验。 BMC生物信息。 22 ( 1 ) : 344 ( 2021 ) [公元30年] 泽玉霞 , 崔英波 , 张昂(Ang Zhang) , 张鹏(音译) , 司凡龙 , 陶唐 , 林鹏 , Chun Huang先生 , 杨灿群 , 廖祥科 :
用于SMRT读取的大规模并行对齐算法。 ICA3PP(2) 2021 : 213-229 2020 [j13] 方建斌 , Chun Huang先生 , 陶唐 , 郑旺(音) :
异构多核并行编程模型:一项综合调查。 CCF变速器。 高性能计算。 2 ( 4 ) : 382-400美元 ( 2020 ) [公元12年] 陈静(音译) , 方建斌 , 刘伟峰 , 陶唐 , 杨灿群 :
clMF:一种用于并行矩阵分解的细粒度、可移植的交替最小二乘算法。 未来一代。 计算。 系统。 108 : 1192-1205 ( 2020 ) [公元11年] 张鹏(音译) , 方建斌 , 杨灿群 , Chun Huang先生 , 陶唐 , 郑旺(音) :
在异构多核架构上优化流并行性。 IEEE传输。 并行分布式系统。 31 ( 8 ) : 1878-1896 ( 2020 ) [i5] 张鹏(音译) , 方建斌 , 杨灿群 , Chun Huang先生 , 陶唐 , 郑旺(音) :
在异构多核体系结构上优化流并行性:一种基于机器学习的方法。 CoRR公司 abs/2003.04294 ( 2020 ) [i4] 方建斌 , Chun Huang先生 , 陶唐 , 郑旺(音) :
异构多核并行编程模型:综述。 CoRR公司 abs/2005.04094 ( 2020 )
2010 – 2019
2019 [公元29年] 郑文旭 , 方建斌 , 陈娟 , 吴飞豪 , 潘晓东 , 王浩(Hao Wang) , 孙晓乐 , 袁媛 , 谢敏(音) , Chun Huang先生 , 陶唐 , 郑旺(音) :
大型并行系统上MPI集合操作的自动调整。 HPCC/智慧城市/DSS 2019 : 670-677 2018 [公元10年] 陈旭浩(Xuhao Chen) , 程晨 , 杰申 , 方建斌 , 陶唐 , 杨灿群 , 王志英 :
协调GPU上强连接组件的并行检测。 并行计算。 78 : 101-114 ( 2018 ) [c28] 张鹏(音译) , 陶唐 , 方建斌 , Chun Huang先生 , 杨灿群 , 郑旺(音) :
MOCL:matrix-2000体系结构的高效openCL实现。 穿越火线 2018 : 26-35 [公元27年] 张鹏(音译) , 方建斌 , 陶唐 , 杨灿群 , 郑旺(音) :
在Intel Xeon Phi上自动调整流式应用程序。 IPDPS公司 2018 : 515-525 [i3] 张鹏(音译) , 方建斌 , 陶唐 , 杨灿群 , 郑旺(音) :
在Intel Xeon Phi上调整流式应用程序:基于机器学习的方法。 CoRR公司 abs/1802.02760 ( 2018 ) 2017 [公元9年] 程晨 , 方建斌 , 陶唐 , 杨灿群 :
异构系统上的LU分解:实现高性能的节能方法。 计算 99 ( 8 ) : 791-811 ( 2017 ) [j8] 陈旭浩(Xuhao Chen) , 李平凡 , 方建斌 , 陶唐 , 王志英 , 杨灿群 :
GPU上高效且高质量的稀疏图着色。 同意。 计算。 实际。 支出。 29 ( 10 ) ( 2017 ) [j7] 陈静(音译) , 方建斌 , 陶唐 , 杨灿群 :
多核/众核平台上推荐算法的实现与性能评估 (基于多核/多核平台的推荐算法的实现和性能评估)。 日本 44 ( 10 ) : 71-74 ( 2017 ) [j6] 陶唐 , 林鹏 , Chun Huang先生 , 杨灿群 :
面向存储层次设计优化的GPU程序性能分析,以实现更好的内存层次结构设计。 日本 44 ( 12 ) : 1-10 ( 2017 ) [c26] 西阳 , 方建斌 , 陈静(音译) , 吴成坤 , 陶唐 , 陆凯 :
推荐系统的高性能坐标下降矩阵分解。 Conf.计算前沿 2017 : 117-126 [公元25年] 陈静(音译) , 方建斌 , 刘伟峰 , 陶唐 , 陈旭浩(Xuhao Chen) , 杨灿群 :
推荐系统的高效便携式ALS矩阵分解。 IPDPS研讨会 2017 : 409-418 [公元24年] 方建斌 , 张鹏(音译) , 陶唐 , Chun Huang先生 , 杨灿群 :
在ARMv8多核CPU上实现和评估OpenCL。 ISPA/IUCC 2017 : 860-867 【c23】 李平凡 , 陈旭浩(Xuhao Chen) , 杰申 , 方建斌 , 陶唐 , 杨灿群 :
GPU上稀疏图中强连接组件的高性能检测。 PMAM@PPoPP项目 2017 : 48-57 2016 [j5] 方建斌 , 张鹏(音译) , 李兆奎 , 陶唐 , 陈旭浩(Xuhao Chen) , 程晨 , 杨灿群 :
评估异构平台上的多个流。 并行过程。 莱特。 26 ( 4 ) : 1640002:1-1640002:18 ( 2016 ) [公元22年] 杨灿群 , 程晨 , 陶唐 , 陈旭浩(Xuhao Chen) , 方建斌 , 薛静玲 :
异构系统上LU分解的能效实现。 ICPADS公司 2016 : 971-979 【c21】 李平凡 , 陈旭浩(Xuhao Chen) , 哲泉 , 方建斌 , 苏华友 , 陶唐 , 杨灿群 :
GPGPU上的高性能并行图着色。 IPDPS研讨会 2016 : 845-854 [公元20年] 李兆奎 , 方建斌 , 陶唐 , 陈旭浩(Xuhao Chen) , 程晨 , 杨灿群 :
评估基于MIC的异构平台上多个流的性能影响。 IPDPS研讨会 2016 : 1341-1350 [第19条] 李兆奎 , 方建斌 , 陶唐 , 陈旭浩(Xuhao Chen) , 杨灿群 :
异构平台上的流应用程序。 NPC公司 2016 : 116-129 [i2] 李兆奎 , 方建斌 , 陶唐 , 陈旭浩(Xuhao Chen) , 程晨 , 杨灿群 :
评估多个流对基于MIC的异构平台的性能影响。 CoRR公司 abs/1603.08619 ( 2016 ) [i1] 李兆奎 , 方建斌 , 陶唐 , 陈旭浩(Xuhao Chen) , 杨灿群 :
异构平台上的流应用程序。 CoRR公司 abs/1608.03044 ( 2016 ) 2015 [第18条] 廖祥科 , 杨灿群 , 哲泉 , 陶唐 , 程晨 :
内存检查点系统中一种高效的基于Clique的计算节点分配算法。 英思科 2015 : 197-211 2014 【j4】 廖祥科 , 杨灿群 , 陶唐 , 慧展易 , 王峰(音) , 吴强 , 薛晶凌 :
OpenMC:简化天河超级计算机的编程。 J.计算。 科学。 Technol公司。 29 ( 三 ) : 532-546 ( 2014 ) 2013 [j3] 吴强 , 杨灿群 , 陶唐 , 利群晓 :
在PB级非均匀系统上开发分子动力学的层次并行性。 J.并行分布式计算。 73 ( 12 ) : 1592-1604 ( 2013 ) [第17条] 吴强 , 杨灿群 , 陶唐 , 利群晓 :
短程分子动力学模拟的MIC加速。 中远国际@CGO 2013 : 2 [第16条] 程晨 , 杨灿群 , 陶唐 , 吴强 , 张鹏飞 :
OpenACC到Intel卸载:自动翻译和优化。 NCCET考试 2013 : 111-120 2012 [注2] 杨学军 , 陶唐 , 王贵宾(Guibin Wang) , 佳佳 , 许新海 :
MPtostream:用于CPU-GPU异构并行系统的OpenMP编译器。 科学。 中国信息科学。 55 ( 9 ) : 1961-1971 ( 2012 ) 2011 [第15条] 陶唐 , 杨学军 , 林一松 :
基于堆栈距离剖面的GPU程序缓存未命中分析。 ICDCS系统 2011 : 623-634 [第14条] 林一松 , 陶唐 , 王贵宾(Guibin Wang) :
基于软件预取的GPU程序功耗优化。 TrustCom公司 2011 : 1339-1346年 2010 [第13条] 陶唐 , 许新海 , 林一松 :
CPU-GPU平台上流程序的数据通信调度器。 CIT公司 2010 : 139-146 [第12条] 徐东芳 , 余华堂 , 王贵宾(Guibin Wang) , 陶唐 , 张颖(音) :
使用流编程模型优化多线程GPU架构上的模板应用程序。 ARCS公司 2010 : 234-245 [第11条] 杨学军 , 李旺 , 薛静玲 , 陶唐 , 任晓光 , 森耶(Sen Ye) :
通过需求驱动的数据平铺改进草稿行分配。 案例 2010 : 127至136 [第10条] 任晓光 , 余华堂 , 王贵宾(Guibin Wang) , 陶唐 , 徐东芳 :
基于多线程GPU的LBM基准测试的优化与实现。 DSDE公司 2010 : 116年至122年
2000年至2009年
2009 [j1] 杨学军 , 于登 , 李旺 , 肖伯燕 , 荆都 , 张颖(音) , 王贵宾(Guibin Wang) , 陶唐 :
SRF着色:通过图形着色进行流寄存器文件分配。 J.计算。 科学。 Technol公司。 24 ( 1 ) : 152-164 ( 2009 ) 【c9】 王贵宾(Guibin Wang) , 陶唐 , 徐东方 , 任晓光 :
使用CUDA和Brook+的多线程GPU上阵列密集型SPEC2k基准的程序优化。 ICPADS公司 2009 : 292-299 [c8] 王贵斌 , 杨学军 , 张颖(音) , 陶唐 , 徐东芳 :
基于模板的GPU加速系统应用程序优化。 国际防止虐待协会 2009 : 219-225 2008 【c7】 荆都 , 余华堂 , 涪江澳 , 陶唐 , 杨学军 :
模型引导的条带尺寸选择,在想象流处理器上实现最小的执行时间。 CIT公司 2008 : 267-272 【c6】 李旺 , 杨学军 , 薛晶凌 , 于登 , 严小波 , 陶唐 , 全黄阮 :
优化流处理器上的科学应用程序循环。 LCTES公司 2008 : 161-170 2007 【c5】 荆都 , 杨学军 , 杨文静 , 陶唐 , 王贵宾(Guibin Wang) :
在Imagine流处理器上实现和评估Jacobi迭代。 高性能计算机 2007 : 221-232 [c4] 肖伯燕 , 陶唐 , 于登 , 荆都 , 杨学军 :
想象建筑的先验功能评估。 ICPP公司 2007 : 53 【c3】 荆都 , 杨学军 , 王贵宾(Guibin Wang) , 陶唐 , 曾坤 :
将科学应用映射到Imagine的基于体系结构的优化。 国际防止虐待协会 2007 : 32至43 【c2】 李旺 , 杨学军 , 王贵宾(Guibin Wang) , 肖伯燕 , 于登 , 荆都 , 张颖(音) , 陶唐 , 曾坤 :
稀疏矩阵向量乘法在Imagine流处理器上的实现与优化。 国际防止虐待协会 2007 : 44-55 【c1】 张颖(音) , 陶唐 , 李将军 , 杨学军 :
流处理器上密集LU分解的实现与优化。 PPAM公司 2007 : 78-88