IWOCL 2020:虚拟活动/德国慕尼黑
西蒙·麦金托什-史密斯 :
IWOCL’20:OpenCL国际研讨会,虚拟活动/德国慕尼黑,2020年4月27日至29日。 ACM公司 2020 ,国际标准图书编号 978-1-4503-7531-3 Michal Mrozek先生 , 本·阿什堡 , 詹姆斯·布罗德曼 :
将内存管理提升到下一个级别:统一共享内存正在运行。 1:1-1:3 约希姆·梅耶 :
图像处理的现代GPGPU技术评估。 2:1-2:2 阿纳斯塔西亚·斯图洛娃 , 尼尔·海克 , 斯文·范·哈斯特雷特 , 马可·安托尼尼 , 凯文·佩蒂特 :
C++for OpenCL编程语言。 3:1-3:2 鲁曼·雷耶斯 , 戈登·布朗 , 活塞杆烧伤 , 迈克尔·黄 :
SYCL 2020:不折不扣。 4:1 鲁曼·雷耶斯 , 戈登·布朗 , 活塞杆烧伤 :
为SYCL提供Nvidia®硬件的性能支持。 5:1 阿拉斯泰尔·默里 , 伊万·克劳福德 :
Compute Aorta:一个用于实现异构编程模型的工具包。 6:1-6:2 本·阿什堡 , 阿列克谢·巴德 , 詹姆斯·布罗德曼 , 杰夫·哈蒙德 , 迈克尔·金斯纳 , S.John Penny图书 , 罗兰·舒尔茨 , 杰森·苏厄尔 :
数据并行C++:通过扩展提高生产力和性能来增强SYCL。 7:1-7:2 阿克塞尔阿尔佩 , 文森特·赫维林 :
超越OpenCL的SYCL:hipSYCL的体系结构、当前状态和未来方向。 8:1 塞德里克·安德烈奥利 , 扎哈尔·马特维耶夫 , 弗拉基米尔·钦巴尔 :
使用Offload Advisor建模异构计算性能。 9:1-9:2 Sohan Lal公司 , 阿克塞尔阿尔佩 , 菲利普·萨尔兹曼 , 比亚吉奥·科森扎 , 尼古拉·斯塔维诺加 , 彼得·托曼 , 托马斯·法林格 , 文森特·赫维林 :
SYCL-Bench:异构计算的通用单源基准套件。 10:1 弗雷迪·威瑟登 , 彼得·文森特 :
在PyFR中使用OpenCL的经验:2014年至今。 11:1 汤姆·迪肯 , 西蒙·麦金托什-史密斯 :
评估HPC型SYCL应用程序的性能。 12:1-12:11 巴里斯·阿克特穆尔 , 马库斯·梅茨格 , 娜塔莉亚·塞亚波娃 , 米哈伊尔斯·斯特拉桑斯 :
在异构英特尔®;体系结构上调试SYCL程序。 13:1-13:10 泰姬·西格拉里克 , Rok Cesnovar公司 , 埃里克·斯特伦贝尔 :
Stan Math的自动OpenCL GPU内核融合。 14:1-14:6 阿迪蒂亚·奇卢库里 , 乔什·米尔索普 , 博·约翰斯顿 :
使用独立于体系结构的程序功能表征内存访问模式的优化。 15:1-15:11 布莱恩寄宿 , 约翰·R·特拉姆 :
评估NVIDIA V100 GPU上HPC内核的hipSYCL工具链的性能。 16:1-16:7 彼得·托曼 , 马库斯擦拭器 , 罗伯特·赫兰尼茨基 , 托马斯·法林格 :
RTX-RSim:飞行时间成像的加速Vulkan房间响应模拟。 17:1-17:11 米查尔·巴贝 , 佩卡·Jääskeläinen :
HIPCL:通过HIP将CUDA应用程序移植到高级OpenCL平台的工具。 18:1-18:3 扬·索兰蒂 , 米查尔·巴贝 , 朱利叶斯·伊卡拉 , 佩卡·Jääskeläinen :
POCL-R:用于低延迟远程卸载的分布式OpenCL运行时。 19:1-19:2 孟世勋于 , 陈泰良 , 李延奎 :
使用clDNN在OpenCL设备上加速NNEF框架。 20:1-20:2 Botond Szilniczky-罗斯 , 伊斯特凡Z.Reguly :
MG-CFD微型应用程序与SYCL的性能可移植性。 21:1-21:2 尼古拉斯·查莫夫 , 萨米尔·申德 , 艾伦·D·马洛尼 :
利用TAU进行多平台SYCL剖面分析。 22:1-22:2 彼得·卡尔采夫 :
使用OpenCL进行高性能微磁模拟。 23:1-23:2 彼得·卡尔采夫 :
量子Boltzmann方程的高性能GPGPU OpenCL模拟。 24:1-24:2 Bolan Jiang公司 , Jeng-Hau Lin先生 , 阿达斯·戈利凯里(Adarsh Golikeri) , 李贺 , 王洪强 , 亚历克斯·鲍德 :
使用OpenCL在Adreno Mobile GPU上训练机器学习网络。 25:1-25:2 李贺 , 王洪强 , 阿达斯·戈利凯里(Adarsh Golikeri) , 亚历克斯·鲍德 , Iih Wangh Adarsh先生 :
用于Adreno GPU的TVM。 26:1-26:2 苏加塔·蒂布雷瓦拉 , 亚历山德罗·德·奥利维拉·法里亚 :
通过使用oneAPI和基于SYCL/C++的DPC++构建的Bio Metrics应用程序确保银行安全。 27:1 塞萨尔·冈萨雷斯 , 西蒙·巴洛科 , 拉蒙·蓬斯 :
利用OpenCL并行指令和数据传输优化,在FPGA上加速pp-Distance算法。 28:1-28:2 Moteb Alghamdi公司 :
基于OpenCL的FPGA并发映射设计空间探索:浅水模型内核的案例研究。 29:1