米哈伊尔·斯梅尔扬斯基
人员信息
优化列表
2020年–今天
2022 [公元41年] 伊桑·K·阿德斯塔尼 , Changkyu Kim(金昌奎) , Seung Jae Lee(李承宰) , 洛尚盘 , Jens Axboe公司 , 瓦尔米基·兰佩萨德 , 巴尼特·阿格拉瓦尔 , 余福勋 , 余安莎 , Trung Le公司 , 赫克托·袁 , 迪瓦萨·穆迪盖尔 , Shishir Juluri公司 , 阿克沙特·南达 , 马诺伊·沃德卡 , 克里希那库马尔·奈尔 , 马克西姆·诺莫夫 , 克里斯·彼得尔森 , 米哈伊尔·斯梅尔扬斯基 , 维杰·拉奥 :
通过软件定义内存支持大规模DLRM推断。 ICDCS系统 2022 : 302-312 [公元40年] 迪瓦萨·穆迪盖尔 , 于晨浩 , 黄建宇 , 贾志浩 , 安德鲁·塔洛赫 , 斯里尼瓦斯·斯里德哈兰 , Xing Liu(刘星) , 穆斯塔法·奥兹达尔 , 杰德·聂 , Jongsoo公园 , 梁洛 , 杨洁艾米 , 莱昂·高 , 德米特罗·伊夫琴科 , 阿尔蒂·巴桑特 , 玉溪湖 , 杨吉燕(Jiyan Yang) , 伊桑·K·阿德斯塔尼 , 王晓东 , 拉凯什·科穆拉维利 , 清朝楚国 , 塞尔哈特·伊尔马兹 , 李华宇 , 钱济源 , 卓伯·冯 , 马银斌 , 杨俊杰 , 埃莉·文 , 李红(音) , 林阳(Lin Yang) , 孙崇林 , 惠特尼·赵 , Dimitry熔体 , 克里希纳·杜利帕拉 , K.R.Kishore公司 , 泰勒·格拉芙 , 阿萨夫·艾森曼 , 基兰·库马尔·马塔姆 , 阿迪·甘吉迪 , 陈国强(Jerry Chen) , 马诺伊·克里希南 , 阿维纳什·纳亚克 , 克里希纳库马尔·奈尔 , 巴拉斯·穆提亚 , 马哈茂德·霍拉沙迪 , 帕拉布·巴塔查里亚 , 彼得·拉普霍夫 , 马克西姆·诺莫夫 , 阿吉特·马修斯 , 林乔 , 米哈伊尔·斯梅尔扬斯基 , 比尔·贾 , 维杰·拉奥 :
软件-硬件协同设计,用于深度学习推荐模型的快速可扩展培训。 国际标准协会 2022 : 993-1011 [公元39年] 阿萨夫·艾森曼 , 基兰·库马尔·马塔姆 , 史蒂文·英格拉姆 , 迪瓦萨·穆迪盖尔 , 拉古拉曼·克里希纳莫西 , 克里希纳库马尔·奈尔 , 米沙·斯梅尔扬斯基 , 穆拉利·阿纳瓦拉姆 :
Check-N-Run:用于训练深度学习推荐模型的检查点系统。 NSDI公司 2022 : 929-943 [公元38年] 科林·昂格尔 , 贾志浩 , 魏武 , 新浪林 , 曼迪普·贝恩斯 , 卡洛斯·埃夫兰·金特罗·纳瓦兹 , 维奈罗摩克里希纳亚 , 尼马尔·普拉贾帕蒂 , 帕特里克·S·麦考密克 , 贾马卢丁·穆赫德·尤索夫 , 西罗 , 迪瓦萨·穆迪盖尔 , Jongsoo公园 , 米沙·斯梅尔扬斯基 , 亚历克斯·艾肯 :
统一:通过代数变换和并行化的联合优化加快DNN训练。 OSDI公司 2022 : 267-284 2021 [公元11年] 邓兆霞 , Jongsoo公园 , Ping Tak彼得·唐 , 刘海欣(Haixin Liu) , 杨杰(音译) , Hector Yuen先生 , 黄建宇 , 大亚·尚克·库迪亚 , 魏小涵 , 埃莉·文 , 德鲁夫·乔达里 , 拉古拉曼·克里希纳莫西 , 卡罗尔·让·吴 , 纳达图尔·萨蒂什 , Changkyu Kim(金昌奎) , 马克西姆·诺莫夫 , 萨姆·纳赫希内赫 , 米哈伊尔·斯梅尔扬斯基 :
低精度硬件架构满足大规模推荐模型推断。 IEEE微型 41 ( 5 ) : 93-100 ( 2021 ) [i17] 大亚·尚克·库迪亚 , 黄建宇 , 普洛努·巴苏 , 夏登 , 刘海欣(Haixin Liu) , Jongsoo公园 , 米哈伊尔·斯梅尔扬斯基 :
FBGEMM:实现高性能低精度深度学习推断。 CoRR公司 腹肌/2101.05615 ( 2021 ) [i16] 迪瓦萨·穆迪盖尔 , 于晨浩 , 黄建宇 , 安德鲁·塔洛赫 , 斯里尼瓦斯·斯里德哈兰 , Xing Liu(刘星) , 穆斯塔法·奥兹达尔 , 杰德·聂 , Jongsoo公园 , 梁洛 , 杨洁艾米 , 莱昂·高 , 德米特罗·伊夫琴科 , 阿尔蒂·巴桑特 , 玉溪湖 , 杨吉燕(Jiyan Yang) , 伊桑·K·阿德斯塔尼 , 王晓东 , 拉凯什·科穆拉维利 , 清朝楚国 , 塞尔哈特·伊尔马兹 , 李华宇 , 钱济源 , 卓伯·冯 , 马银斌 , 杨俊杰 , 埃莉·文 , 李红(音) , 林阳(Lin Yang) , 孙崇林 , 惠特尼·赵 , Dimitry熔体 , 克里希纳·杜利帕拉 , K.R.Kishore公司 , 泰勒·格拉芙 , 阿萨夫·艾森曼 , 基兰·库马尔·马塔姆 , 阿迪·甘吉迪 , 陈国强(Jerry Chen) , 马诺伊·克里希南 , 阿维纳什·纳亚克 , 克里希纳库马尔·奈尔 , 巴拉斯·穆提亚 , 马哈茂德·霍拉沙迪 , 帕拉布·巴塔查里亚 , 彼得·拉普霍夫 , 马克西姆·诺莫夫 , 林乔 , 米哈伊尔·斯梅尔扬斯基 , 比尔·贾 , 维杰·拉奥 :
大规模深度学习推荐模型的高性能分布式培训。 CoRR公司 腹肌/2104.05158 ( 2021 ) 【i15】 邓兆霞 , Jongsoo公园 , Ping Tak彼得·唐 , 刘海欣(Haixin Liu) , 杨杰(音译) , Hector Yuen先生 , 黄建宇 , 大亚·尚克·库迪亚 , 魏晓翰 , 埃莉·文 , 德鲁夫·乔达里 , 拉古拉曼·克里希纳莫西 , 卡罗尔·让·吴 , 纳达图尔·萨蒂什 , Changkyu Kim(金昌奎) , 马克西姆·诺莫夫 , 萨姆·纳赫希内赫 , 米哈伊尔·斯梅尔扬斯基 :
低精度硬件体系结构满足大规模推荐模型推断。 CoRR公司 abs/2105.12676 ( 2021 ) [第14条] 伊桑·K·阿德斯塔尼 , Changkyu Kim(金昌奎) , Seung Jae Lee(李承宰) , 螺上盘 , 瓦尔米基·兰佩萨德 , Jens Axboe公司 , 巴尼特·阿格拉瓦尔 , 余福勋 , 余安莎 , Trung Le公司 , Hector Yuen先生 , Shishir Juluri公司 , 阿克沙特·南达 , 马诺伊·沃德卡 , 迪瓦萨·穆迪盖尔 , 克里希纳库马尔·奈尔 , 马克西姆·诺莫夫 , 克里斯彼得森 , 米哈伊尔·斯梅尔扬斯基 , 维杰·拉奥 :
通过软件定义内存支持大规模DLRM推断。 CoRR公司 腹肌/2110.11489 ( 2021 ) [i13] 拉维·克里希纳 , 阿拉文德·卡莱亚 , 吴碧琴 , 马克西姆·诺莫夫 , 迪瓦萨·穆迪盖尔 , 米莎·斯梅尔扬斯基 , 库尔特·科伊策 :
不同NAS框架及其在广告CTR预测中的应用。 CoRR公司 abs/2110.14812 ( 2021 ) 2020 [公元37年] 乌迪特·古普塔 , 卡罗尔·让·吴 , 王晓东 , 马克西姆·诺莫夫 , 布兰登·里根 , 大卫·布鲁克斯 , 布拉德福德-科特尔 , 金·哈泽尔伍德 , 马可·亨普斯特德 , 比尔·贾 , 李显新 , 安德烈·马列维奇 , 迪瓦萨·穆迪盖尔 , 米哈伊尔·斯梅尔扬斯基 , 梁雄 , 张宣 :
脸书基于DNN的个性化推荐的架构含义。 HPCA公司 2020 : 488-501 [公元36年] 刘科 , 乌迪特·古普塔 , 本杰明·杨家·赵 , 大卫·布鲁克斯 , 维卡斯·钱德拉 , 乌特库·迪里尔 , 阿明·菲鲁兹沙扬 , 金·哈泽尔伍德 , 比尔·贾 , 李显新 , 孟莉(Meng Li) , 伯特·马赫 , 迪瓦萨·穆迪盖尔 , 马克西姆·诺莫夫 , 马丁·沙茨 , 米哈伊尔·斯梅尔扬斯基 , 王晓东 , 布兰登·里根 , 卡罗尔·让·吴 , 马可·亨普斯特德 , 张宣 :
RecNMP:通过近记忆处理加速个性化推荐。 国际标准协会 2020 : 790-803 [i12] 马克西姆·诺莫夫 , 约翰·金 , 迪瓦萨·穆迪盖尔 , 斯里尼瓦斯·斯里德哈兰 , 王晓东 , 惠特尼·赵 , 塞尔哈特·伊尔马兹 , Changkyu Kim(金昌奎) , Hector Yuen先生 , 穆斯塔法·奥兹达尔 , 克里希纳库马尔·奈尔 , 伊莎贝尔·高 , 苏伯乐 , 杨吉燕(Jiyan Yang) , 米哈伊尔·斯梅尔扬斯基 :
Facebook数据中心的深度学习培训:扩展和扩展系统的设计。 CoRR公司 abs/2003.09518 ( 2020 ) [i11] 阿萨夫·艾森曼 , 基兰·库马尔·马塔姆 , 史蒂文·英格拉姆 , 迪瓦萨·穆迪盖尔 , 拉古拉曼·克里希纳莫西 , 穆拉利·阿纳瓦拉姆 , 克里希纳库马尔·奈尔 , 米沙·斯梅尔扬斯基 :
Check-N-Run:训练推荐模型的检查点系统。 CoRR公司 2010年8月679日 ( 2020 )
2010 – 2019
2019 [公元35年] 米沙·斯梅尔扬斯基 :
锡安:脸书新一代大内存训练平台。 热芯片研讨会 2019 : 1-22 [公元34年] 阿萨夫·艾森曼 , 马克西姆·诺莫夫 , 达里尔·加德纳 , 米沙·斯梅尔扬斯基 , 谢尔盖·普皮耶夫 , 金·哈泽尔伍德 , 阿萨夫·西登 , 萨钦·卡蒂 :
Bandana:使用非易失性存储器存储深度学习模型。 系统建模语言 2019 [i10] 迪拉杰·D·卡拉姆卡尔 , 迪瓦萨·穆迪盖尔 , 纳文·梅伦普迪 , 迪班卡Das , 库纳尔·巴纳吉 , Sasikanth Avancha公司 , 达玛·特贾·沃图里 , 纳塔拉吉·贾马拉马达卡 , 黄建宇 , Hector Yuen先生 , 杨吉燕(Jiyan Yang) , Jongsoo公园 , 亚历山大·海内克 , 埃万盖洛斯·乔治亚纳斯 , 苏达珊·斯里尼瓦桑 , 阿披实昆都 , 米莎·斯梅尔扬斯基 , 巴拉特·考尔 , 普拉迪普·杜比 :
BFLOAT16用于深度学习培训的研究。 CoRR公司 abs/1905.12322 ( 2019 ) [第九章] 马克西姆·诺莫夫 , 迪瓦萨·穆迪盖尔 , 郝俊迈克尔·施 , 黄建宇 , 纳拉亚南·桑达拉曼 , Jongsoo公园 , 王晓东 , 乌迪特·古普塔 , 卡罗尔·让·吴 , Alisson G.Azzolini公司 , 德米特罗·朱尔加科夫 , 安德烈·马尔利维奇 , 伊利亚·切尔尼亚夫斯基 , 英海路 , 拉古拉曼·克里希纳莫西 , 余安莎 , 沃洛德米尔·孔德拉滕科 , 斯蒂芬妮·佩雷拉 , 陈贤杰(Xianjie Chen) , 陈文林 , 维杰·拉奥 , 比尔·贾 , 梁雄 , 米沙·斯梅尔扬斯基 :
个性化推荐系统的深度学习推荐模型。 CoRR公司 abs/1906.00091 ( 2019 ) [i8] 乌迪特·古普塔 , 王晓东 , 马克西姆·诺莫夫 , 卡罗尔·让·吴 , 布兰登·里根 , 大卫·布鲁克斯 , 布拉德福德-科特尔 , 金·哈泽尔伍德 , 比尔·贾 , 李显新 , 安德烈·马列维奇 , 迪瓦萨·穆迪盖尔 , 米哈伊尔·斯梅尔扬斯基 , 梁雄 , 张宣 :
Facebook基于DNN的个性化推荐的体系结构含义。 CoRR公司 abs/1906.03109 ( 2019 ) [i7] 刘科 , 乌迪特·古普塔 , 卡罗尔·让·吴 , 本杰明·杨宰(Benjamin Youngjae Cho) , 马可·亨普斯特德 , 布兰登·里根 , 张宣 , 大卫·M·布鲁克斯 , 维卡斯·钱德拉 , 乌特库·迪里尔 , 阿明·菲鲁兹沙扬 , 金·哈泽尔伍德 , 比尔·贾 , 李显新 , 孟莉(Meng Li) , 伯特·马赫 , 迪瓦萨·穆迪盖尔 , 马克西姆·诺莫夫 , 马丁·沙茨 , 米哈伊尔·斯梅尔扬斯基 , 王晓东 :
RecNMP:通过近记忆处理加速个性化推荐。 CoRR公司 abs/1912.12953 ( 2019 ) 2018 [公元33年] 金·哈泽尔伍德 , 莎拉·伯德 , 大卫·M·布鲁克斯 , 苏密斯·钦塔拉 , 乌特库·迪里尔 , 德米特罗·朱尔加科夫 , 穆罕默德·法兹 , 比尔·贾 , 杨庆佳 , 阿迪蒂亚·卡尔罗 , 罗发礼 , 李兆光 , 杰森·卢 , 彼得·诺德胡斯 , 米沙·斯梅尔扬斯基 , 梁雄 , 王晓东 :
脸书应用机器学习:数据中心基础设施视角。 HPCA公司 2018 : 620-629年 [i6] 纳达夫·罗特姆 , Jordan Fix公司 , Saleem Abdulrasool公司 , 夏登 , 罗曼·扎巴罗夫 , 詹姆斯·赫格曼 , 罗曼·莱文斯坦 , 伯特·马赫 , 纳达图尔·萨蒂什 , 雅各布·奥尔森 , Jongsoo公园 , 阿特姆·拉霍夫 , 米沙·斯梅尔扬斯基 :
发光:神经网络的图形降低编译器技术。 CoRR公司 abs/1805.00907 ( 2018 ) [i5] 阿萨夫·艾森曼 , 马克西姆·诺莫夫 , 达里尔·加德纳 , 米沙·斯梅尔扬斯基 , 谢尔盖·普皮耶夫 , 金·哈泽尔伍德 , 阿萨夫·西登 , 萨钦·卡蒂 :
Bandana:使用非易失性存储器存储深度学习模型。 CoRR公司 abs/1811.05922 ( 2018 ) [i4] Jongsoo公园 , 马克西姆·诺莫夫 , 质子巴苏 , 夏登 , 阿拉文德·卡莱亚 , 大亚·尚克·库迪亚 , 罗发礼 , 帕特·马拉尼 , 安德烈·马列维奇 , 纳达图尔·萨蒂什 , 胡安·米盖尔·皮诺 , 马丁·沙茨 , 亚历山大·西多罗夫 , 维斯瓦纳特·西瓦库马尔 , 安德鲁·塔洛赫 , 王晓东 , 吴一鸣 , Hector Yuen先生 , 乌特库·迪里尔 , 德米特罗·朱尔加科夫 , 金·哈泽尔伍德 , 比尔·贾 , 杨庆佳 , 林乔 , 维杰·拉奥 , 纳达夫·罗特姆 , Sungjoo Yoo先生 , 米哈伊尔·斯梅尔扬斯基 :
脸书数据中心中的深度学习推断:特征描述、性能优化和硬件含义。 CoRR公司 abs/1811.09886 ( 2018 ) 2017 [公元32年] 西河 , 迪瓦萨·穆迪盖尔 , 米哈伊尔·斯梅尔扬斯基 , 马丁·塔卡奇 :
深度神经网络的分布式无Hessian优化。 AAAI研讨会 2017 [公元31年] 尼提什·谢里什·凯斯卡 , 迪瓦萨·穆迪盖尔 , 豪尔赫·诺塞达尔 , 米哈伊尔·斯梅尔扬斯基 , Ping Tak彼得·唐 :
关于深度学习的大批量培训:泛化差距和极大极小。 ICLR公司 2017 2016 [公元10年] Jongsoo公园 , 米哈伊尔·斯梅尔扬斯基 , Karthikeyan Vaidyanathan公司 , 亚历山大·海内克 , 迪拉杰·D·卡拉姆卡尔 , Mostofa Ali Patwary医生 , 瓦迪姆·奥·皮罗戈夫 , 普拉迪普·杜比 , Xing Liu(刘星) , 卡洛斯·罗萨莱斯 , 西里尔·马扎里奇 , 克里斯托弗·戴利 :
基于IA的多核和多核处理器的高性能共轭梯度基准优化。 国际期刊高性能计算。 申请。 30 ( 1 ) : 11-27 ( 2016 ) [公元9年] 周爱德蒙德(Edmond Chow) , Xing Liu(刘星) , 桑奇特·米斯拉 , 马拉特·杜坎 , 米哈伊尔·斯梅尔扬斯基 , 杰夫·哈蒙德 , 杜云飞 , 廖祥科 , 普拉迪普·杜比 :
扩大Hartree-Fock对天河二号的计算。 国际期刊高性能计算。 申请。 30 ( 1 ) : 85-102 ( 2016 ) [j8] 现场G.Van Zee , 泰勒·M·史密斯 , 布莱恩标记 , 子梦低 , 罗伯特·范·德盖恩 , 弗朗西斯科·伊古尔 , 米哈伊尔·斯梅尔扬斯基 , 张贤义(Xianyi Zhang) , 迈克尔·基斯特勒 , 弗农·奥斯特 , 约翰·甘纳尔斯 , 李·基洛 :
BLIS框架:可移植性实验。 ACM事务处理。 数学。 柔和。 42 ( 2 ) : 12:1-12:19 ( 2016 ) [公元30年] 洪博荣 , Jongsoo公园 , 灵香香 , 托德·安德森 , 米哈伊尔·斯梅尔扬斯基 :
稀疏线性代数的上下文驱动优化。 PACT公司 2016 : 247-259年 [公元29年] 斯科特·萨勒宁 , 纳达图尔·萨蒂什 , 米哈伊尔·斯梅尔扬斯基 , 萨曼提卡S.Sury , 克里斯托弗·雷 :
共享内存中的高性能并行随机梯度下降。 IPDPS公司 2016 : 873-882 [公元28年] 托马斯·哈纳 , 达米安·斯泰格 , 米哈伊尔·斯梅尔扬斯基 , 马提亚斯·特洛伊尔 :
量子电路的高性能仿真。 联合国安全理事会 2016 : 866-874 [i3] 米哈伊尔·斯梅尔扬斯基 , 尼古拉斯·P·D·萨瓦亚 , 阿兰·阿斯普鲁·古兹克 :
qHiPSTER:量子高性能软件测试环境。 CoRR公司 abs/1601.07195 ( 2016 ) [i2] 西河 , 迪瓦萨·穆迪盖尔 , 米哈伊尔·斯梅尔扬斯基 , 马丁·塔卡奇 :
深度神经网络的大规模分布式无Hessian优化。 CoRR公司 abs/1606.00511 ( 2016 ) [i1] 尼提什·谢里什·凯斯卡 , 迪瓦萨·穆迪盖尔 , 豪尔赫·诺塞达尔 , 米哈伊尔·斯梅尔扬斯基 , 邓炳德 :
关于深度学习的大批量培训:泛化差距和极大极小。 CoRR公司 abs/1609.04836 ( 2016 ) 2015 [j7] 纳达图尔·萨蒂什 , Changkyu Kim(金昌奎) , 贾廷·丘加尼 , 斋藤秀树 , 拉凯什·克里希奈耶(Rakesh Krishnaiyer) , 米哈伊尔·斯梅尔扬斯基 , 米林·吉尔卡 , 普拉迪普·杜比 :
传统编程能否弥补并行计算应用程序的忍者性能差距? Commun公司。 ACM公司 58 ( 5 ) : 77-86 ( 2015 ) [公元27年] 迪瓦萨·穆迪盖尔 , 斯里尼瓦斯·斯里德哈兰 , 阿南德·德什潘德 , Jongsoo公园 , 亚历山大·海内克 , 米哈伊尔·斯梅尔扬斯基 , 巴拉特·考尔 , 普拉迪普·杜比 , 迪内什·K·考希克 , 大卫·E·凯斯 :
探索现代并行系统上非结构化网格CFD应用的共享内存优化。 IPDPS公司 2015 : 723-732 [c26] Jongsoo公园 , 米哈伊尔·斯梅尔扬斯基 , 尤里克·梅耶·杨 , 迪瓦萨·穆迪盖尔 , 普拉迪普·杜比 :
针对基于多核的分布式并行系统优化的高性能代数多重网格求解器。 联合国安全理事会 2015 : 54:1-54:12 2014 [公元25年] 泰勒·M·史密斯 , 罗伯特·范·德盖恩 , 米哈伊尔·斯梅尔扬斯基 , 杰夫·哈蒙德 , 现场G.Van Zee :
高性能多线程矩阵乘法剖析。 IPDPS公司 2014 : 1049年-1059年 [公元24年] Karthikeyan Vaidyanathan公司 , 基兰·帕姆纳尼 , 迪拉杰·D·卡拉姆卡尔 , 亚历山大·海内克 , 米哈伊尔·斯梅尔扬斯基 , Jongsoo公园 , 大云·金 , 阿尼鲁达·谢特(Aniruddha G.Shet) , 巴拉特·考尔 , 巴林特·乔奥 , 普拉迪普·杜比 :
改进Intel Xeon Phi协处理器群集上本机应用程序的通信性能和可扩展性。 IPDPS公司 2014 : 1083-1092年 【c23】 亚历山大·海内克 , 亚历山大·布鲁尔 , 塞巴斯蒂安·雷滕伯格 , 迈克尔·巴德 , 艾丽斯·阿格妮斯·加布里埃尔 , 克里斯蒂安·佩尔提斯 , 阿恩特·博德 , 威廉·巴思 , 廖祥科 , Karthikeyan Vaidyanathan公司 , 米哈伊尔·斯梅尔扬斯基 , 普拉迪普·杜比 :
异构超级计算机上的Petascale高阶动态破裂地震模拟。 联合国安全理事会 2014 : 3-14 [公元22年] 西蒙·海布罗克 , 巴林特·乔奥 , 迪拉杰·D·卡拉姆卡尔 , 米哈伊尔·斯梅尔扬斯基 , Karthikeyan Vaidyanathan公司 , Tilo Wettig公司 , 普拉迪普·杜比 :
Intel®Xeon Phi协处理器上带域分解的Lattice QCD。 联合国安全理事会 2014 : 69-80 【c21】 Jongsoo公园 , 米哈伊尔·斯梅尔扬斯基 , Karthikeyan Vaidyanathan公司 , 亚历山大·海内克 , 迪拉杰·D·卡拉姆卡尔 , Xing Liu(刘星) , Mostofa Ali Patwary医生 , 宇通路 , 普拉迪普·杜比 :
高性能共轭梯度基准的高效共享内存实现及其在非结构化矩阵中的应用。 联合国安全理事会 2014 : 945-955 [公元20年] Jongsoo公园 , 米哈伊尔·斯梅尔扬斯基 , 纳拉亚南·桑达拉姆 , 普拉迪普·杜比 :
高性能共享内存稀疏三角解算器的稀疏同步。 国际协调委员会 2014 : 124-140 2013 [j6] Jongsoo公园 , 邓炳德 , 米哈伊尔·斯梅尔扬斯基 , 大云·金 , 被托马斯·本森 :
基于多核处理器的高效反投影合成孔径雷达计算。 科学。 程序。 21 ( 3-4 ) : 165-179 ( 2013 ) [第19条] Xing Liu(刘星) , 米哈伊尔·斯梅尔扬斯基 , 周爱德蒙德(Edmond Chow) , 普拉迪普·杜比 :
基于x86的多核处理器上的高效稀疏矩阵向量乘法。 内部控制系统 2013 : 273-282 [第18条] 亚历山大·海内克 , Karthikeyan Vaidyanathan公司 , 米哈伊尔·斯梅尔扬斯基 , 亚历山大·科博托夫 , 罗曼·杜布佐夫 , 格雷格·亨利 , 阿尼鲁达·谢特(Aniruddha G.Shet) , 乔治·克莱索斯 , 普拉迪普·杜比 :
基于Intel®Xeon Phi协处理器的单节点和多节点系统Linpack基准测试的设计与实现。 IPDPS公司 2013 : 126-137 [第17条] 西蒙·彭尼库克 , 克里斯托弗·休斯 , 米哈伊尔·斯梅尔扬斯基 , 斯蒂芬·A·贾维斯 :
探索SIMD for Molecular Dynamics,使用Intel®Xeon®处理器和Intel®Xeon Phi协处理器。 IPDPS公司 2013 : 1085-1097 [第16条] 巴林特·乔奥 , 迪拉杰·D·卡拉姆卡尔 , Karthikeyan Vaidyanathan公司 , 米哈伊尔·斯梅尔扬斯基 , 基兰·帕姆纳尼 , 维克多·W·李 , 普拉迪普·杜比 , 威廉·沃森三世 :
Intel®Xeon PhiTM协处理器上的Lattice QCD。 国际协调委员会 2013 : 40-54 2012 [第15条] Xing Liu(刘星) , 周爱德蒙德(Edmond Chow) , Karthikeyan Vaidyanathan公司 , 米哈伊尔·斯梅尔扬斯基 :
通过多个右侧和右侧改进动态模拟的性能。 IPDPS公司 2012 : 36-47 [第14条] 迪拉杰·D·卡拉姆卡尔 , 约书亚·D·特泽斯科 , 斯里尼瓦斯·斯里德哈兰 , 米哈伊尔·斯梅尔扬斯基 , 大云·金 , 阿曼多·曼杜卡 , 舒云红 , 马特·伯恩斯坦 , 巴拉特·考尔 , 普拉迪普·杜比 :
基于X86的现代多核系统上的高性能非均匀FFT。 IPDPS公司 2012 : 449-460 [第13条] 纳达图尔·萨蒂什 , Changkyu Kim(金昌奎) , 贾廷·丘加尼 , 斋藤秀树 , 拉凯什·克里希奈耶 , 米哈伊尔·斯梅尔扬斯基 , 米林·吉尔卡 , 普拉迪普·杜比 :
传统编程能否弥补Ninja并行计算应用程序的性能差距? 国际标准协会 2012 : 440-451 [c12] Jongsoo公园 , Ping Tak彼得·唐 , 米哈伊尔·斯梅尔扬斯基 , 大云·金 , 被托马斯·本森 :
基于多核处理器的高效反投影合成孔径雷达计算。 联合国安全理事会 2012 : 28 [第11条] 哈佛大学的威廉斯 , 迪拉杰·D·卡拉姆卡尔 , 阿米克·辛格 , 阿南德·德什潘德 , 布莱恩·范·斯特拉伦 , 米哈伊尔·斯梅尔扬斯基 , 安·S·阿尔姆格伦 , 普拉迪普·杜比 , 约翰·沙尔夫 , 列奥尼德·奥利克 :
针对新兴多核处理器的几何多重网格优化。 联合国安全理事会 2012 : 96 [第10条] 米哈伊尔·斯梅尔扬斯基 , 杰森·苏厄尔 , 迪拉杰·D·卡拉姆卡尔 , 纳达图尔·萨蒂什 , 普拉迪普·杜比 , 尼基塔·阿斯塔菲耶夫 , 伊利亚·布里洛夫 , 安德烈·尼古拉耶夫 , 谢尔盖·迈达诺夫 , 朔丽 , 苏尼尔·库尔卡尼 , 查尔斯·菲南 , 叶卡捷琳娜·戈尼娜 :
基于现代多核IA架构的财务分析基准分析与优化。 SC伴侣 2012 : 1154-1162 2011 [j5] 迈克尔·迪舍 , 米哈伊尔·斯梅尔扬斯基 , 布莱恩·尼克森 , 维克多·W·李 , 迈克尔·丘韦列夫 , 普拉迪普·杜比 :
为多核/多核设计和动态负载平衡混合LU。 计算。 科学。 资源开发。 26 ( 3-4 ) : 211-220 ( 2011 ) 【j4】 大云·金 , 约书亚·特扎斯科 , 米哈伊尔·斯梅尔扬斯基 , 克利夫顿·海德尔 , 普拉迪普·杜比 , 阿曼多·曼杜卡 :
使用多核结构的高性能3D压缩传感MRI重建。 国际生物医学杂志。 成像 2011 : 473128:1-473128:11 ( 2011 ) 【c9】 米哈伊尔·斯梅尔扬斯基 , Karthikeyan Vaidyanathan公司 , Jee W.Choi先生 , 巴林特·乔奥 , 贾廷·丘加尼 , 迈克尔·克拉克 , 普拉迪普·杜比 :
基于多核并行系统的高性能晶格QCD,使用缓存友好的混合线程MPI方法。 联合国安全理事会 2011 : 69:1-69:11 [电子1] 米哈伊尔·斯梅尔扬斯基 , 狄克逊 , 大卫·戴利 , 玛丽亚·埃利夫特里奥 , 何塞·莫雷拉 , Kyung Dong Ryu(京东柳) :
2011年11月13日,WHPCF’11,与SC11合办的第四届高性能计算金融研讨会会议记录,西雅图,华盛顿州,美国。 ACM公司 2011 ,国际标准图书编号 978-1-4503-1108-3 [目录] 2010 【c8】 维克多·W·李 , Changkyu Kim(金昌奎) , 贾廷·丘加尼 , 迈克尔·戴舍 , 大云·金 , 安东尼·D·阮 , 纳达图尔·萨蒂什 , 米哈伊尔·斯梅尔扬斯基 , 斯里尼瓦斯·陈努帕蒂 , 佩尔·哈马伦德 , 罗纳克·辛哈尔 , 普拉迪普·杜比 :
揭穿100X GPU vs.CPU神话:CPU和GPU吞吐量计算的评估。 国际标准协会 2010 : 451-460
2000 – 2009
2009 [j3] 米哈伊尔·斯梅尔扬斯基 , 大卫·R·福尔摩斯三世 , 贾廷·丘加尼 , 艾伦·拉森 , 道格·卡米恩 , 丹尼斯·P·汉森 , 普拉迪普·杜比 , 库尔特·奥古斯丁 , 金大铉 , 艾伦·凯克 , 维克多·W·李 , 安东尼·D·阮 , 拉瑞·塞勒 , 理查德·罗布 :
将医学成像的高保真体绘制映射到CPU、GPU和多核心架构。 IEEE传输。 视觉。 计算。 图表。 15 ( 6 ) : 1563-1570 ( 2009 ) 2008 [注2] 何塞·路易斯·莫拉莱斯 , 豪尔赫·诺塞达尔 , 米哈伊尔·斯梅尔扬斯基 :
对称线性互补问题的快速求解算法。 数值数学 111 ( 2 ) : 251-266 ( 2008 ) [j1] Yen-Kuang Chen先生 , 贾廷·丘加尼 , 普拉迪普·杜比 , 克里斯托弗·休斯 , 大云·金 , 森吉·昆玛 , 维克多·W·李 , 安东尼·D·阮 , 米哈伊尔·斯梅尔扬斯基 :
识别、挖掘和合成工作量的收敛及其含义。 程序。 电气与电子工程师协会 96 ( 5 ) : 790-807 ( 2008 ) 【c7】 森吉·昆玛 , 大云·金 , 米哈伊尔·斯梅尔扬斯基 , 甄光珍 , 贾廷·丘加尼 , 克里斯托弗·休斯 , Changkyu Kim(金昌奎) , 维克多·W·李 , 安东尼·D·阮 :
芯片多处理器上的原子向量操作。 国际标准协会 2008 : 441-452 2007 【c6】 米哈伊尔·斯梅尔扬斯基 , 维克多·W·李 , 大云·金 , 安东尼·D·阮 , 普拉迪普·杜比 :
大规模芯片多处理器系统中内点方法的缩放性能。 联合国安全理事会 2007 : 22 2004 【c5】 米哈伊尔·斯梅尔扬斯基 , 斯科特·A·马尔克 , 爱德华·S·戴维森 :
概率谓词感知模块调度。 CGO公司 2004 : 151-162 2003 【c4】 凯文·范 , 内森·克拉克 , 迈克尔·L·朱 , K.V.Manjunath公司 , 拉吉夫·拉文德兰 , 米哈伊尔·斯梅尔扬斯基 , 斯科特·A·马尔克 :
针对特定于应用程序的处理器的系统注册绕过自定义。 尽快 2003 : 64-74 【c3】 米哈伊尔·斯梅尔扬斯基 , 斯科特·A·马尔克 , 爱德华·S·戴维森 , 李显新 :
谓词感知调度:一种减少资源约束的技术。 CGO公司 2003 : 169-178 2001 [c2] 李显新 , 米哈伊尔·斯梅尔扬斯基 , 克里斯·纽伯恩 , 加里·泰森 :
堆栈值文件:堆栈的自定义微体系结构。 HPCA公司 2001 : 5-14 2000 【c1】 米哈伊尔·斯梅尔扬斯基 , 加里·泰森 , 爱德华·S·戴维森 :
注册队列:一种新的硬件/软件高效软件流水线方法。 IEEE协议 2000 : 3-12