摘要
[未注明日期]。 AIBench:数据中心AI基准套件。 https://www.benchcouncil.org/AIBench网站/ 谷歌学者 [未注明日期]。 阿帕奇节俭。。 https://frice.apache.org。 谷歌学者 [未注明日期]。 自动替换文本。。 https://wordpress.org/plugins/automatic-alternative-text(英文)/ 谷歌学者 【名词】。 脸书和Instagram最佳字幕。。 https://play.google.com/store/apps/details?id=com.caption.facebook.instagram&hl=en_US 谷歌学者 [未注明日期]。 bgfx-跨平台渲染库。 https://github.com/bkaradzic/bgfx 谷歌学者 [未注明日期]。 标题AI:Instagram/FB的标题和哈希标签。。 https://play.google.com/store/apps/details?id=caption.ai&hl=en_US 谷歌学者 [未注明日期]。 数据中心对GPU计算有胃口。。 https://www.nextplatform.com/2020/02/15/the-datacenter-has-an-appetite-for-gpu-compute/ 谷歌学者 【名词】。 Python的面部识别api。 github.com/ageitgey/脸认知 谷歌学者 [未注明日期]。 FFmpeg:一个完整的跨平台解决方案,用于录制、转换和流式传输音频和视频。。 https://ffmpeg.org/ 谷歌学者 [未注明日期]。 人工智能和机器学习用例中的GPU。。 https://www.weka.io/blog/gpu-for-ai-ml-deep-learning网站/ 谷歌学者 [未注明日期]。 gRPC。 https://www.grpc.io网站/ 谷歌学者 [未注明日期]。 月光。 https://moonlight-stream.org/ 谷歌学者 [未注明日期]。 NVIDIA CUDAAPI公司。 https://docs.nvidia.com/cuda/cuda-runtime-api/group__CUDART_DEVICE.html 谷歌学者 [未注明日期]。 内维迪亚·达利。 https://github.com/NVIDIA/DALI网站 谷歌学者 [未注明日期]。 Nvidia Night Compute公司。 docs.nvidia.com/nsight-compute/NsightCompute/index.html 谷歌学者 [未注明日期]。 OpenNMT:一个开源的神经机器翻译系统。 开放网络/ 谷歌学者 白岩城、张永强、丁明丽和加尼姆。 2018年。在IEEE计算机视觉和模式识别会议(CVPR)上,利用生成性对抗网络在野外发现微小面孔。 21–30. https://doi.org/10.109/CVPR.2018.00010 谷歌学者 交叉引用 梁宝、蔡思武、布晓萱、任娜娜和沈梦青。 2019.云中基于微服务的应用程序的性能建模和工作流调度。 IEEE并行和分布式系统汇刊, https://doi.org/10.109/TPDS.2019.2901467 谷歌学者 数字图书馆 路易斯·安德烈·巴罗佐(Luiz AndréBarroso)和乌尔斯·霍尔兹勒(Urs Hölzle)。 2009年,作为计算机的数据中心:仓库规模机器设计简介。 计算机体系结构综合讲座,4,1(2009),1–108。 https://doi.org/10.2200/S00516ED2V01Y201306CAC024 谷歌学者 交叉引用 杰拉德·比亚和埃尔万·斯科内特。 2016年,随机森林导览。 测试,25,2(2016),197-227。 谷歌学者 交叉引用 Tom B Brown、Benjamin Mann、Nick Ryder、Melanie Subbiah、Jared Kaplan、Prafulla Dhariwal、Arvind Neelakantan、Pranav Shyam、Girish Sastry和Amanda Askell。 2020年。语言模型是少有的学习者。 arXiv预打印arXiv:2005.14165。 谷歌学者 Shuai Che、Michael Boyer、Jiayuan Meng、David Tarjan、Jeremy W Sheaffer、Sang-Ha Lee和Kevin Skadron。 2009年,Rodinia:异构计算的基准套件。 在国际工作量表征研讨会(IISWC)上。 44–54. https://doi.org/10.109/IISWC.2009.5306797 谷歌学者 数字图书馆 陈国洋、赵岳、沈喜鹏和周惠阳。 2017年。Effisha:实现gpu高效抢占式调度的软件框架。 第22届ACM SIGPLAN并行编程原理与实践研讨会论文集。 3-16。 https://doi.org/10.1145/3018743.3018748 谷歌学者 数字图书馆 陈泉(Quan Chen)、杨海龙(Hailong Yang)、郭敏毅(Minyi Guo)、拉姆·斯利瓦萨·坎南(Ram Srivatsa Kannan)、杰森·马尔斯(Jason Mars)和汤凌嘉(Lingjia Tang)。 2017.先知:对非抢购加速器进行精确的qos预测,以提高仓库级计算机的利用率。 第二十二届编程语言和操作系统体系结构支持国际会议论文集。 17–32. https://doi.org/10.1145/3037697.3037700 谷歌学者 数字图书馆 陈泉(Quan Chen)、杨海龙(Hailong Yang)、杰森·马尔斯(Jason Mars)和汤凌嘉(Lingjia Tang)。 2016年,Baymax:仓库级计算机中非抢占性加速器的Qos意识和利用率提高。 ACM SIGPLAN通知,51,4(2016),681-696。 https://doi.org/10.1145/2872362.2872368 谷歌学者 数字图书馆 Yutian Chen、Yannis Assael、Brendan Shillingford、David Budden、Scott Reed、Heiga Zen、Quan Wang、Luis C Cobo、Andrew Trask和Ben Laurie,2018年。 示例高效的自适应文本到语音转换。 arXiv预印本arXiv:1809.10460。 谷歌学者 余安忠、魏洪翁、唐学良和詹姆斯·格拉斯。 2019.实现无监督的演讲-文本翻译。 参加ICASSP 2019-2019 IEEE声学、语音和信号处理国际会议(ICASSP)。 7170–7174. https://doi.org/10.109/ICASSP.2019.8683550 谷歌学者 交叉引用 Daniel Crankshaw、Xin Wang、Guilio Zhou、Michael J Franklin、Joseph E Gonzalez和Ion Stoica。 2017年,Clipper:低延迟在线预测服务系统。 在第14届$USENIX$网络系统设计与实现研讨会上($NSDI$17)。 613–627. 谷歌学者 崔伟浩、赵韩、陈泉、郑宁新、冷敬文、赵洁茹、卓松、马涛、杨勇、李超。2021年。 基于确定性操作员重叠和精确的延迟预测,启用同步DNN服务。 《高性能计算、网络、存储和分析国际会议论文集》。 1–15. https://doi.org/10.1145/3458817.3476143 谷歌学者 数字图书馆 杰弗里·迪恩(Jeffrey Dean)和路易斯·安德烈·巴罗佐(Luiz AndréBarroso)。 2013年,规模上的尾部。 Commun公司。 ACM,56,2(2013),74-80。 https://doi.org/10.1145/2408776.2408794 谷歌学者 数字图书馆 邓康乐(Kangle Deng)、费天翼(Tianyi Fei)、黄欣(Xin Huang)和彭玉欣(Yuxin Peng)。 2019.IRC-GAN:用于文本到视频生成的内省复发卷积GAN。 第28届国际人工智能联合会议记录。 2216–2222. https://doi.org/10.24963/ijcai.2019/307 谷歌学者 交叉引用 雅各布·德夫林(Jacob Devlin)、张明伟(Ming Wei Chang)、肯顿·李(Kenton Lee)和克里斯蒂娜·图塔诺娃(Kristina Toutanova)。 2018年,伯特:深度双向变压器语言理解预培训。 arXiv预印本arXiv:1810.04805, https://doi.org/10.18653/v1/n19-1423 谷歌学者 交叉引用 Chao Dong、Chen Change Loy和Xiaou Tang。 2016.加速超分辨率卷积神经网络。在欧洲计算机视觉会议(ECCV)上。 391–407. https://doi.org/10.1007/978-3-319-46475-6_25 谷歌学者 交叉引用 马可·多里戈(Marco Dorigo)、毛罗·比拉塔里(Mauro Birattari)和托马斯·斯图兹勒(Thomas Stutzle)。 2006.蚁群优化。 IEEE计算智能杂志,1,4(2006),28-39。 谷歌学者 数字图书馆 丹尼斯·福利和约翰·丹斯金。 2017年。超性能Pascal GPU和NVLink互连。 IEEE Micro,37,2(2017),7–17。 https://doi.org/10.109/MM.2017.37 谷歌学者 数字图书馆 傅开华、张伟、陈泉、曾德泽、彭欣、郑文丽和郭敏仪。 2021.云边缘连续体中Qos软件和资源高效的微服务部署。 2021年IEEE国际并行和分布式处理研讨会(IPDPS)。 932–941. https://doi.org/10.109/IPDPS49936.2021.00102 谷歌学者 交叉引用 于干(Yu Gan)、张艳琪(Yanqi Zhang)、郑代伦(Dailun Cheng)、安基莎·谢蒂(Ankitha Shetty)、普里亚尔·拉蒂(Priyal Rathi)、纳扬·卡塔基(Nayan Katarki)、阿里亚娜·布鲁诺(Ariana Bruno)、胡士泰(Ju。 2019.微服务开源基准套件及其对云和边缘系统的软硬件影响。 在第二十四届编程语言和操作系统(ASPLOS)架构支持国际会议上。 3–18. https://doi.org/10.1145/3297858.3304013 谷歌学者 数字图书馆 于干(Yu Gan)、张艳琪(Yanqi Zhang)、胡开尔文(Kelvin Hu)、郑代伦(Dailun Cheng)、袁和(Yuan He)、梅格纳·潘科利(Meghna Pancholi)和克里斯蒂娜·德利米特鲁(Christina Delimitrou)。 2019.预言:利用大数据导航云微服务性能调试的复杂性。 在第二十四届程序设计语言和操作系统体系结构支持国际会议上。 19–33. https://doi.org/10.1145/3297858.3304004 谷歌学者 数字图书馆 高连丽、陈代元、宋京宽、徐兴、张东翔、沈恒涛。 2019.文本到图像合成的感知金字塔对抗网络。 https://doi.org/10.1609/aaai.v33i01.33018312 谷歌学者 数字图书馆 Pin Gao、Lingfan Yu、Yu Yongwei Wu和Jinyang Li.2018年。 具有细胞批处理的低延迟RNN推理。 第十三届欧洲系统会议记录。 1–15. https://doi.org/10.1145/3190508.3190541 谷歌学者 数字图书馆 Alim Ul Gias、Giuliano Casale和Murray Woodside。 2019.ATOM:微型服务的模型驱动自动缩放。 在第39届分布式计算系统国际会议上。 1994–2004. https://doi.org/10.109/ICDCS.2019.00197 谷歌学者 交叉引用 谢尔盖·格里赞(Sergey Grizan)、大卫·朱棣文(David Chu)、亚历克·沃尔曼(Alec Wolman)和罗杰·瓦滕霍夫(Roger Wattenhofer)。 2015.dJay:通过动态成本效益GPU负载平衡,为云游戏服务器实现高密度多租户。 第六届ACM云计算研讨会论文集。 58–70. https://doi.org/10.1145/2806777.2806942 谷歌学者 数字图书馆 Arpan Gujarati、Reza Karimi、Safya Alzayat、Wei Hao、Antoine Kaufmann、Ymir Vigfuson和Jonathan Mace。 2020年。像时钟一样为DNN服务:自下而上的性能可预测性。 在第14届$USENIX$操作系统设计与实现研讨会上($OSDI$20)。 443–462. 谷歌学者 乌迪·古普塔(Udit Gupta)、塞缪尔·夏(Samuel Hsia)、维克拉姆·萨拉夫(Vikram Saraph)、王晓东(Xiaodong Wang)、布兰登·里根(Brandon Reagen)、顾延伟(Gu-Yeon Wei)、李显新(Xien-Hesin S Lee)、大卫。 2020.Deeprecsys:一个用于优化端到端规模神经推荐推理的系统。 2020年,ACM/IEEE第47届计算机体系结构国际年会(ISCA)。 982–995. https://doi.org/10.109/ISCA45697.2020.00084 谷歌学者 数字图书馆 Udit Gupta、Carole-Jean Wu、Xiaodong Wang、Maxim Naumov、Brandon Reagen、David Brooks、Bradford Cottel、Kim Hazelwood、Mark Hempstead和Bill Jia。 2020年。脸书基于DNN的个性化推荐的架构含义。 2020年IEEE高性能计算机体系结构(HPCA)国际研讨会。 488–501. https://doi.org/10.1109/HPCA47549.2020.00047 谷歌学者 交叉引用 叶佳、梅尔文·约翰逊、沃尔夫冈·马切里、罗恩·魏斯、袁操、钟成秋、纳文·阿里、斯特拉·劳伦佐和吴永辉。 2019.利用监管薄弱的数据改进端到端的语音到文本翻译。 参加ICASSP 2019-2019 IEEE声学、语音和信号处理国际会议(ICASSP)。 7180–7184之间。 https://doi.org/10.109/ICASSP.2019.8683343 谷歌学者 交叉引用 Ram Srivatsa Kannan、Lavanya Subramanian、Ashwin Raju、Jeongseob Ahn、Jason Mars和Lingjia Tang。 2019.Grandslam:保证微服务执行框架中工作的sla。 2019年第十四届欧洲系统会议记录。 1–16. https://doi.org/10.1145/3302424.3303958 谷歌学者 数字图书馆 安德烈·卡佩西和李飞飞。 2015.生成图像描述的深度视觉-语义对齐。 在IEEE计算机视觉和模式识别(CVPR)会议上。 3128–3137. https://doi.org/10.109/CVPR.2015.7298932 谷歌学者 交叉引用 Shinpei Kato、Karthik Lakshmanan、Raj Rajkumar和Yutaka Ishikawa。 2011.TimeGraph:实时多任务环境的GPU调度。 过程中。 USENIX ATC。 17–30. 谷歌学者 关安东尼(Anthony Kwan)、王乔纳森(Jonathon Wong)、汉斯·阿诺·雅各布森(Hans-Arno Jacobsen)和维诺德·穆萨米(Vinod Muthusamy)。 2019.HyScale:云数据中心码头化微服务的混合和网络扩展。 在第39届分布式计算系统国际会议(ICDCS)上。 80–90. https://doi.org/10.109/ICDCS.2019.00017 谷歌学者 交叉引用 李珊珊(Shanshan Li)、何章(He Zhang)、贾子嘉(Ziga Jia)、郑莉(Zheng Li)和张成(Cheng Zhang,音译)、李嘉琪(音译)、高秋雅(Qiuya Gao)、葛继东(Jidong Ge)。 2019.一种数据流驱动的方法,用于从单片应用程序中识别微服务。 《系统与软件杂志》,157(2019),110380。 https://doi.org/10.1016/j.jss.2019.07.008 谷歌学者 交叉引用 李宇森、山楚旭、陈若兵、汤雪燕、蔡文桐、唐山江、刘晓光、王刚、龚晓丽和张颖。 2019.GAugur:量化协同游戏的性能干扰,以提高云游戏中的资源利用率。 在第28届高性能并行和分布式计算国际研讨会论文集上。 231–242. https://doi.org/10.1145/3307681.3325409 谷歌学者 数字图书馆 杨柳和米雷拉·拉帕塔。 2019.使用预处理编码器进行文本摘要。 arXiv预打印arXiv:1908.08345, https://doi.org/10.18653/v1/D19-1387 谷歌学者 交叉引用 刘宇晨、张家军、熊浩、周龙、何忠军、吴华、王海峰和宗成庆。 2019.同步语音识别和交互式解码的语音到文本翻译。 arXiv预打印arXiv:1912.07240。 谷歌学者 卢明,李恒.2003。 施工规划的资源活动关键路径方法。 建筑工程与管理杂志,129,4(2003),412–420。 https://doi.org/10.1061/ (ASCE)0733-9364(2003)129:4(412) 谷歌学者 交叉引用 格列戈兹·马莱维茨、马修·奥斯特恩、阿尔特·杰西·比克、詹姆斯·德内特、伊兰·霍恩、纳蒂·雷瑟和格列戈兹·扎伊科夫斯基。 2010年。Pregel:大规模图形处理系统。 在ACM国际数据管理会议(SIGMOD)上。 135–146. https://doi.org/10.1145/1807167.1807184 谷歌学者 数字图书馆 拉吉夫·尼什塔拉(Rajiv Nishtala)、保罗·卡彭特(Paul Carpenter)、维尼修斯·彼得鲁奇(Vinicius Petrucci)和泽维尔·马托雷尔(Xavier Martorell)。 2017.Hipster:用于延迟关键云工作负载的混合任务管理器。 2017年IEEE高性能计算机体系结构(HPCA)国际研讨会。 409–420. https://doi.org/10.109/HPCA.2017.13 谷歌学者 交叉引用 拉吉夫·尼什塔拉(Rajiv Nishtala)、维尼修斯·彼得鲁奇(Vinicius Petrucci)、保罗·卡彭特(Paul Carpenter)和马格努斯·贾兰德(Magnus Sjalander)。 2020.Twig:用于共存延迟关键云服务的多代理任务管理。 2020年IEEE高性能计算机体系结构(HPCA)国际研讨会。 167–179. https://doi.org/10.1109/HPCA47549.2020.00023 谷歌学者 交叉引用 英伟达。 2017.NVIDIA特斯拉V100 GPU建筑。。 https://www.nvidia.com/en-us/data-center/nvidia-ampe-gpu-architecture(https://www)/ 谷歌学者 英伟达。 2019.NVIDIA DGX-2系统用户指南。。 docs.nvidia.com/dgx/dgx2-user-guide/index.html 谷歌学者 魏平、彭凯南和陈吉通。 2018.单簧管:端到端文本到语音的并行波生成。 arXiv预印arXiv:1807.07281。 谷歌学者 戚正伟、姚建国、张超、苗宇、杨志洲和关海冰。 2014年,VGRIS:云游戏中虚拟化GPU资源隔离和调度。 ACM架构和代码优化汇刊(TACO),11,2(2014),1-25。 https://doi.org/10.1145/2632216 谷歌学者 数字图书馆 Haoran Qiu、Subho S Banerjee、Saurabh Jha、Zbigniew T Kalbarczyk和Ravishankar K Iyer。 2020年。FIRM:面向SLO的微服务的智能细粒度资源管理框架。 在第14届USENIX操作系统设计与实现(OSDI)研讨会上。 805–825. 谷歌学者 亚历克·拉德福德(Alec Radford)、卢克·梅茨(Luke Metz)和索米斯·钦塔拉(Soumith Chintala)。 2015.使用深度卷积生成对抗网络的无监督表示学习。 arXiv预打印arXiv:1511.06434。 谷歌学者 科林·拉斐尔(Colin Raffel)、诺姆·沙泽尔(Noam Shazeer)、亚当·罗伯茨(Adam Roberts)、凯瑟琳·李(Katherine Lee)、莎兰·纳朗(Sharan Narang)、迈克尔·马泰纳(Michael Matena)、周燕琪(Yanqi Zhou)、李伟。 2019.使用统一的文本到文本转换器探索迁移学习的极限。 arXiv预打印arXiv:1910.10683。 谷歌学者 Scott Reed、Zeynep Akata、Xinchen Yan、Lajanugen Logeswaran、Bernt Schiele和Honglak Lee。 2016.生成性对抗性文本到图像合成。 arXiv预打印arXiv:1605.05396。 谷歌学者 哈西姆·萨克(Hašim Sak)、老安德鲁(Andrew Senior)和弗朗索瓦斯·博费斯(Françoise Beaufays)。 2014.用于大规模声学建模的长-短期记忆递归神经网络架构。 在国际言语交际协会第十五届年会上。 谷歌学者 乔治·AF·塞伯(George AF Seber)和艾伦·J·李(Alan J Lee)。 2012.线性回归分析。 329,John Wiley&Sons。 谷歌学者 沈海晨、陈乐群、金玉晨、赵良玉、孔炳瑜、马泰·菲利普斯、阿文德·克里希纳穆西和拉维·桑达拉姆。 2019.Nexus:用于加速基于DNN的视频分析的GPU集群引擎。 第27届美国计算机学会操作系统原理研讨会论文集。 322–337. https://doi.org/10.1145/3341301.3359658 谷歌学者 数字图书馆 凯伦·西蒙扬和安德鲁·齐瑟曼。 2014.用于大规模图像识别的超深卷积网络。 arXiv预打印arXiv:1409.1556。 谷歌学者 Akshitha Sriraman、Abhishek Dhanotia和Thomas F Wenisch。 2019.Softsku:针对微服务多样性@scale优化服务器架构。 在第46届计算机体系结构国际研讨会上。 513–526. https://doi.org/10.1145/3307650.3322227 谷歌学者 数字图书馆 Peter JM Van Laarhoven和Emile HL Aarts。 1987。模拟退火。 在模拟退火:理论和应用。 施普林格,7-15岁。 谷歌学者 Oriol Vinyals、Alexander Toshev、Samy Bengio和Dumitru Erhan。 2015.展示和讲述:一个神经图像字幕生成器。 在IEEE计算机视觉和模式识别(CVPR)会议上。 3156–3164. https://doi.org/10.109/CVPR.2015.7298935 谷歌学者 交叉引用 王飞、陈立仁、程莉、黄世耀、陈燕杰、陈倩和陈昌乐。 2018年。人脸识别的魔鬼在于噪音。 在欧洲计算机视觉会议(ECCV)上。 765–780. https://doi.org/10.1007/978-3-030-01240-3_47 谷歌学者 数字图书馆 文泽一、石家帅、何炳生、陈健、小塔里·拉马莫哈纳劳和李钦斌。2019。 利用GPU进行有效的梯度增强决策树训练。 IEEE并行和分布式系统汇刊,30,12(2019),2706–2717。 https://doi.org/10.109/TPDS.2019.2920131 谷歌学者 交叉引用 Yecheng Xiang和Hyosung Kim。 2019.多-DNN实时推断的流水线数据并行CPU/GPU调度。 实时系统研讨会(RTSS)。 392–405. https://doi.org/10.109/RTSS46320.2019.00042 谷歌学者 交叉引用 尹国军、刘斌、卢胜、于能海、王晓刚和景绍。 2019.文本到图像生成的语义分离。 在IEEE计算机视觉和模式识别会议(CVPR)上。 2327–2336. https://doi.org/10.1109/CVPR.2019.00243 谷歌学者 交叉引用 俞培凤和穆沙拉夫·乔杜里。 2019.Salus:用于深度学习应用程序的细粒度gpu共享原语。 arXiv预打印arXiv:1902.04610。 谷歌学者 张凯(Kai Zhang)、何炳生(Bingsheng He)、胡佳玉(Jiayu Hu)、王泽科(Zeke Wang)、贝华(Bei Hua)、孟佳怡(Jiayi Meng)和杨丽珊(Lishan Yang)。 2018.G-net:在$NFV$系统中有效分享$GPU$。 在第15届$USENIX$网络系统设计与实现研讨会上($NSDI$18)。 187–200. 谷歌学者 张伟、崔伟浩、傅开华、陈全、丹尼尔·爱德华·马惠特、吴波、李超和郭敏义。 2019.莱乌斯:提高数据中心中空间多任务加速器的延迟意识和利用率。 在ACM超级计算国际会议(ICS)的会议记录中。 58–68. https://doi.org/10.1145/3330345.3330351 谷歌学者 数字图书馆 张伟、傅开华、郑宁新、陈全、李超、郑文丽和郭敏仪。 2021.CHARM:GPU数据中心的协作主机和加速器资源管理。 2021年IEEE第39届国际计算机设计会议(ICCD)。 307–315. https://doi.org/10.109/ICCD53106.2021.00056 谷歌学者 交叉引用 张艳琪(Yanqi Zhang)、华伟哲(Weizhe Hua)、周庄庄(Mangzhuang Zhou)、苏爱德华·德利米特鲁(Edward Suh)和克里斯蒂娜·德利米特鲁。 2021.新浪:基于ML和QoS-Aware的云微服务资源管理。 https://doi.org/10.1145/3445814.3446693 谷歌学者 数字图书馆 Liang Zhou、Laxmi N Bhuyan和KK Ramakrishnan。 2020年,双子座:学习管理潜在关键搜索引擎的CPU能力。 2020年,第53届IEEE/ACM国际微体系结构研讨会(MICRO)。 637–349. https://doi.org/10.1109/MICRO50266.2020.00059 谷歌学者 交叉引用 朱民峰、潘平波、陈伟和杨毅。 2019.Dm-gan:用于文本到图像合成的动态内存生成对抗网络。 在IEEE计算机视觉和模式识别会议(CVPR)上。 5802–5810. https://doi.org/10.109/CVPR.2019.00595 谷歌学者 交叉引用
建议
通过高效的多进程GPU资源共享加速高性能计算 CF’12:第九届计算机前沿会议记录 HPC领域正在见证GPU作为传统同质HPC系统加速器的广泛采用。 SPMD范式是一种流行的并行编程模型,它适用于基于GPU的并行处理。 自从。。。 1600核GPU上的架构软件映射和优化 ICPADS’11:2011 IEEE第17届并行和分布式系统国际会议记录 图形处理单元(GPU)继续成为高性能计算(HPC)的计算加速器。 然而,尽管它越来越流行,映射和优化GPU代码仍然是一项困难的任务,这是一项多。。。