Dhiraj D.卡拉姆卡尔
人员信息
优化列表
2020年–今天
2023 [i12] 埃文格洛斯·乔治亚纳斯 , 迪拉杰·D·卡拉姆卡尔 , 基里尔·沃罗宁 , 安东尼奥·诺克 , 汉斯·帕布斯特 , 亚历山大·布鲁尔 , 亚历山大·海内克 :
通过CPU架构上的高级循环和张量抽象来利用深度学习和HPC内核。 CoRR公司 abs/2304.12576 ( 2023 ) 2022 [j3] 埃万盖洛斯·乔治亚纳斯 , 迪拉杰·D·卡拉姆卡尔 , Sasikanth Avancha公司 , 梅纳希姆·阿德尔曼 , 迪普蒂·阿加瓦尔 , 克里斯蒂娜·安德森 , 亚历山大·布鲁尔 , 杰里米·布鲁斯特尔 , 纳伦德拉·乔杜里 , 阿披实昆都 , 丹尼斯·库特尼克 , 弗兰克·劳布 , 瓦西穆丁 , 桑奇特·米斯拉 , 拉马纳拉扬·莫汉蒂 , 汉斯·帕布斯特 , 布莱恩·雷特福德 , 巴鲁赫·齐夫 , 亚历山大·海内克 :
张量处理原语:深度学习和HPC工作负载中效率和可移植性的编程抽象。 边境申请。 数学。 斯达。 8 : 826269 ( 2022 ) [第19条] 纳伦德拉·乔杜里 , 桑奇特·米斯拉 , 迪拉杰·D·卡拉姆卡尔 , 亚历山大·海内克 , 埃文格洛斯·乔治亚纳斯 , 巴鲁赫·齐夫 , 梅纳希姆·阿德尔曼 , 巴拉特·考尔 :
加速基于深度学习的染色质可及性识别,从有噪声的ATAC-seq数据中进行。 IPDPS研讨会 2022 : 176-185 2021 [第18条] 埃文格洛斯·乔治亚纳斯 , 迪拉杰·D·卡拉姆卡尔 , Sasikanth Avancha公司 , 梅纳希姆·阿德尔曼 , 克里斯蒂娜·安德森 , 亚历山大·布鲁尔 , 杰里米·布鲁斯特尔 , 纳伦德拉·乔杜里 , 阿披实昆都 , 丹尼斯·库特尼克 , 弗兰克·劳布 , 瓦西穆丁 , 桑奇特·米斯拉 , 拉马纳拉扬·莫汉蒂 , 汉斯·帕布斯特 , 巴鲁赫·齐夫 , 亚历山大·海内克 :
张量处理原语:在深度学习工作负载中提高效率和可移植性的编程抽象。 联合国安全理事会 2021 : 14 [第17条] 瓦西姆丁中校 , 桑奇特·米斯拉 , 马桂香 , 拉马纳拉扬·莫汉蒂 , 埃文格洛斯·乔治亚纳斯 , 亚历山大·海内克 , Dhiraj D.卡拉姆卡尔 , 内斯林·K·艾哈迈德 , Sasikanth Avancha公司 :
DistGNN:大规模图形神经网络的可扩展分布式训练。 联合国安全理事会 2021 : 76 [i11] 埃文格洛斯·乔治亚纳斯 , 迪拉杰·D·卡拉姆卡尔 , Sasikanth Avancha公司 , 梅纳希姆·阿德尔曼 , 克里斯蒂娜·安德森 , 亚历山大·布鲁尔 , 纳伦德拉·乔达里 , 阿披实昆都 , 瓦西姆丁中校 , 桑奇特·米斯拉 , 拉马纳拉扬·莫汉蒂 , 汉斯·帕布斯特 , 巴鲁赫·齐夫 , 亚历山大·海内克 :
张量处理原语:深度学习工作负载中效率和可移植性的编程抽象。 CoRR公司 abs/2104.05755 ( 2021 ) [i10] 瓦西姆丁中校 , 桑奇特·米斯拉 , 马桂香 , 拉马纳拉扬·莫汉蒂 , 埃文格洛斯·乔治亚纳斯 , 亚历山大·海内克 , 迪拉杰·D·卡拉姆卡尔 , 内斯林·K·艾哈迈德 , Sasikanth Avancha公司 :
DistGNN:用于大规模图神经网络的可扩展分布式训练。 CoRR公司 abs/2104.06700 ( 2021 ) [第九章] 纳伦德拉·乔杜里 , 桑奇特·米斯拉 , 迪拉杰·D·卡拉姆卡尔 , 亚历山大·海内克 , 埃文格洛斯·乔治亚纳斯 , 巴鲁赫·齐夫 , 梅纳希姆·阿德尔曼 , 巴拉特·考尔 :
用于深度学习的高效通用一维扩张卷积层。 CoRR公司 abs/2104.08002 ( 2021 ) 2020 [第16条] 埃文格洛斯·乔治亚纳斯 , 库纳尔·巴纳吉 , 迪拉杰·D·卡拉姆卡尔 , Sasikanth Avancha公司 , 阿南德·文卡特 , 迈克尔·安德森 , 格雷格·亨利 , 汉斯·帕布斯特 , 亚历山大·海内克 :
通过单个构建块利用深度学习。 IPDPS公司 2020 : 222-233 [第15条] 迪拉杰·D·卡拉姆卡尔 , 埃文格洛斯·乔治亚纳斯 , 苏达珊·斯里尼瓦桑 , 陈建平 , 米哈伊尔·谢里耶夫 , 亚历山大·海内克 :
优化关于CPU集群体系结构的深度学习推荐系统培训。 联合国安全理事会 2020 : 43 [i8] 迪拉杰·D·卡拉姆卡尔 , 埃文格洛斯·乔治亚纳斯 , 苏达珊·斯里尼瓦桑 , 陈建平 , 米哈伊尔·谢里耶夫 , 亚历山大·海内克 :
优化深度学习推荐系统的CPU集群架构培训。 CoRR公司 abs/2005.04680 ( 2020 )
2010 – 2019
2019 [注2] 库纳尔·巴纳吉 , 埃万盖洛斯·乔治亚纳斯 , 迪拉杰·D·卡拉姆卡尔 , 巴鲁赫·齐夫 , 伊登·西格尔 , 克里斯蒂娜·安德森 , 亚历山大·海内克 :
在英特尔体系结构上优化深度学习RNN拓扑。 超级计算机。 前面。 因诺夫。 6 ( 三 ) : 64-85 ( 2019 ) [第14条] 迪拉杰·D·卡拉姆卡尔 , 库纳尔·巴纳吉 , 苏达珊·斯里尼瓦桑 , 斯里尼瓦斯·斯里德哈兰 , 埃文格洛斯·乔治亚纳斯 , 米哈伊尔·斯莫卡洛夫 , 丛旭 , 亚历山大·海内克 :
在英特尔CPU群集上训练谷歌神经机器翻译。 集群 2019 : 1-10 [i7] 迪拉杰·D·卡拉姆卡尔 , 迪瓦萨·穆迪盖尔 , 纳文·梅伦普迪 , 迪班卡Das , 库纳尔·巴纳吉 , Sasikanth Avancha公司 , 达玛·特贾·沃图里 , 纳塔拉吉·贾马拉马达卡 , 黄建宇 , Hector Yuen先生 , 杨纪艳 , Jongsoo公园 , 亚历山大·海内克 , 埃文格洛斯·乔治亚纳斯 , 苏达珊·斯里尼瓦桑 , 阿披实昆都 , 米沙·斯梅尔扬斯基 , 巴拉特·考尔 , 普拉迪普·杜比 :
BFLOAT16用于深度学习培训的研究。 CoRR公司 abs/1905.12322 ( 2019 ) [i6] 埃文格洛斯·乔治亚纳斯 , 库纳尔·巴纳吉 , Dhiraj D.卡拉姆卡尔 , Sasikanth Avancha公司 , 阿南德·文卡特 , 迈克尔·安德森 , 格雷格·亨利 , 汉斯·帕布斯特 , 亚历山大·海内克 :
通过单个构建块实现高性能深度学习。 CoRR公司 abs/1906.06440 ( 2019 ) [i5] 阿披实昆都 , 苏达珊·斯里尼瓦桑 , 埃里克·C·秦 , 迪拉杰·D·卡拉姆卡尔 , 纳文·梅伦普迪 , 迪潘卡·达斯 , 库纳尔·巴纳吉 , 巴拉特·考尔 , 普拉迪普·杜比 :
K-TanH:深度学习的硬件高效激活。 CoRR公司 abs/1909.07729 ( 2019 ) 2018 [第13条] 迪班卡Das , 纳文·梅伦普迪 , 迪瓦萨·穆迪盖尔 , 迪拉杰·D·卡拉姆卡尔 , Sasikanth Avancha公司 , 库纳尔·巴纳吉 , 斯里尼瓦斯·斯里德哈兰 , 卡西克·维迪亚纳桑 , 巴拉特·考尔 , 埃文格洛斯·乔治亚纳斯 , 亚历山大·海内克 , 普拉迪普·杜比 , 杰苏斯·科尔巴尔 , 尼基塔·舒斯特罗夫 , 罗曼·杜布佐夫 , 埃瓦里斯特·福门科 , 瓦迪姆·奥·皮罗戈夫 :
使用整数运算的卷积神经网络的混合精度训练。 ICLR(海报) 2018 [第12条] 埃文格洛斯·乔治亚纳斯 , Sasikanth Avancha公司 , 库纳尔·巴纳吉 , 迪拉杰·D·卡拉姆卡尔 , 格雷格·亨利 , 汉斯·帕布斯特 , 亚历山大·海内克 :
剖析SIMD体系结构上的高性能深度学习卷积。 联合国安全理事会 2018 : 66:1-66:12 [i4] 斯里尼瓦斯·斯里德哈兰 , Karthikeyan Vaidyanathan公司 , 迪拉杰·D·卡拉姆卡尔 , 迪班卡Das , 米哈伊尔·斯莫尔卡洛夫 , 米哈伊尔·谢里耶夫 , 迪瓦萨·穆迪盖尔 , 纳文·梅伦普迪 , Sasikanth Avancha公司 , 巴拉特·考尔 , 普拉迪普·杜比 :
针对云计算和高性能计算的扩展式深度学习培训。 CoRR公司 abs/1801.08030 ( 2018 ) [i3] 迪班卡Das , 纳文·梅伦普迪 , 迪瓦萨·穆迪盖尔 , 迪拉杰·D·卡拉姆卡尔 , Sasikanth Avancha公司 , 库纳尔·巴纳吉 , 斯里尼瓦斯·斯里德哈兰 , 卡西克·维迪亚纳桑 , 巴拉特·考尔 , 埃文格洛斯·乔治亚纳斯 , 亚历山大·海内克 , 普拉迪普·杜比 , 杰苏斯·科尔巴尔 , 尼基塔·舒斯特罗夫 , 罗曼·杜布佐夫 , 埃瓦里斯特·福门科 , 瓦迪姆·皮罗戈夫 :
使用整数运算的卷积神经网络的混合精度训练。 CoRR公司 abs/1802.00930 ( 2018 ) [i2] 埃文格洛斯·乔治亚纳斯 , Sasikanth Avancha公司 , 库纳尔·巴纳吉 , 迪拉杰·D·卡拉姆卡尔 , 格雷格·亨利 , 汉斯·帕布斯特 , 亚历山大·海内克 :
剖析SIMD体系结构上的高性能深度学习卷积。 CoRR公司 abs/1808.05567 ( 2018 ) 2016 [j1] 钟洙公园 , 米哈伊尔·斯梅尔扬斯基 , Karthikeyan Vaidyanathan公司 , 亚历山大·海内克 , 迪拉杰·D·卡拉姆卡尔 , Mostofa Ali Patwary医生 , 瓦迪姆·奥·皮罗戈夫 , 普拉迪普·杜贝 , Xing Liu(刘星) , 卡洛斯·罗萨莱斯 , 西里尔·马扎里奇 , 克里斯托弗·戴利 :
基于IA的多核和多核处理器的高性能共轭梯度基准优化。 国际期刊高性能计算。 申请。 30 ( 1 ) : 11-27 ( 2016 ) [第11条] 巴林特·乔奥 , 迪拉杰·D·卡拉姆卡尔 , 托尔斯滕·库思 , Karthikeyan Vaidyanathan公司 , 亚伦·沃尔登 :
针对英特尔®;KNL优化Wilson Dirac算子和线性解算器。 ISC研讨会 2016 : 415-427 [i1] 迪班卡Das , Sasikanth Avancha公司 , 迪瓦萨·穆迪盖尔 , Karthikeyan Vaidyanathan公司 , 斯里尼瓦斯·斯里德哈兰 , 迪拉杰·D·卡拉姆卡尔 , 巴拉特·考尔 , 普拉迪普·杜比 :
使用同步随机梯度下降的分布式深度学习。 CoRR公司 abs/1602.06709 ( 2016 ) 2015 [第10条] Karthikeyan Vaidyanathan公司 , 迪拉杰·D·卡拉姆卡尔 , 基兰·帕姆纳尼 , 杰夫·哈蒙德 , 巴凡·巴拉吉 , 迪班卡Das , Jongsoo公园 , 巴林特·乔奥 :
使用软件卸载改进多线程MPI应用程序中的并发性和异步性。 联合国安全理事会 2015 : 30:1-30:12 2014 【c9】 Karthikeyan Vaidyanathan公司 , 基兰·帕姆纳尼 , 迪拉杰·D·卡拉姆卡尔 , 亚历山大·海内克 , 米哈伊尔·斯梅尔扬斯基 , Jongsoo公园 , 大云·金 , 阿尼鲁达·谢特(Aniruddha G.Shet) , 巴拉特·考尔 , 巴林特·乔奥 , 普拉迪普·杜比 :
改进Intel Xeon Phi协处理器群集上本机应用程序的通信性能和可扩展性。 IPDPS公司 2014 : 1083-1092 【c8】 西蒙·海布罗克 , 巴林特·乔奥 , 迪拉杰·D·卡拉姆卡尔 , 米哈伊尔·斯梅尔扬斯基 , Karthikeyan Vaidyanathan公司 , Tilo Wettig公司 , 普拉迪普·杜比 :
Intel®Xeon Phi协处理器上带域分解的Lattice QCD。 联合国安全理事会 2014 : 69-80 【c7】 斯里尼瓦斯·斯里德哈兰 , 詹姆斯·迪南 , 迪拉杰·D·卡拉姆卡尔 :
通过基于库的MPI端点实现实现高效的多线程MPI通信。 联合国安全理事会 2014 : 487至498 【c6】 Jongsoo公园 , 米哈伊尔·斯梅尔扬斯基 , Karthikeyan Vaidyanathan公司 , 亚历山大·海内克 , 迪拉杰·D·卡拉姆卡尔 , Xing Liu(刘星) , 马里兰州Mostofa Ali Patwary , 宇通路 , 普拉迪普·杜比 :
高性能共轭梯度基准的高效共享内存实现及其在非结构化矩阵中的应用。 联合国安全理事会 2014 : 945-955年 2013 【c5】 巴林特·乔奥 , 迪拉杰·D·卡拉姆卡尔 , Karthikeyan Vaidyanathan公司 , 米哈伊尔·斯梅尔扬斯基 , 基兰·帕姆纳尼 , 维克多·W·李 , 普拉迪普·杜贝 , 威廉·沃森三世 :
Intel®Xeon PhiTM协处理器上的Lattice QCD。 英思科 2013 : 40-54 2012 【c4】 迪拉杰·D·卡拉姆卡尔 , 约书亚·D·特泽斯科 , 斯里尼瓦斯·斯里德哈兰 , 米哈伊尔·斯梅尔扬斯基 , 大云·金 , 阿曼多·曼杜卡 , 舒云红 , 马特·伯恩斯坦 , 巴拉特·考尔 , 普拉迪普·杜比 :
基于X86的现代多核系统上的高性能非均匀FFT。 IPDPS公司 2012 : 449-460 【c3】 哈佛大学的威廉斯 , 迪拉杰·D·卡拉姆卡尔 , 阿米克·辛格 , 阿南德·德什潘德 , 布莱恩·范·斯特拉伦 , 米哈伊尔·斯梅尔扬斯基 , 安·S·阿尔姆格伦 , 普拉迪普·杜比 , 约翰·沙尔夫 , 列奥尼德·奥利克 :
针对新兴多核处理器的几何多重网格优化。 联合国安全理事会 2012 : 96 【c2】 米哈伊尔·斯梅尔扬斯基 , 杰森·苏厄尔 , 迪拉杰·D·卡拉姆卡尔 , 纳达图尔·萨蒂什 , 普拉迪普·杜贝 , 尼基塔·阿斯塔菲耶夫 , 伊利亚·布里洛夫 , 安德烈·尼古拉耶夫 , 谢尔盖·迈达诺夫 , 朔丽 , 苏尼尔·库尔卡尼 , 查尔斯·菲南 , 叶卡捷琳娜·戈尼娜 :
基于现代多核IA架构的财务分析基准分析与优化。 SC伴侣 2012 : 1154-1162
2000 – 2009
2007 【c1】 迪拉杰·D·卡拉姆卡尔 , 美纳克·乔杜里 , 马克·海因里希 :
利用目录协议线程简化活动内存集群。 ISPASS公司 2007 : 242-253