阿米特·萨本
人员信息
优化列表
![笔记](https://dblp.uni-trier.de/img/note-mark.dark.12x12.png)
2020年–今天
2023 [第18条] 王世波(Shibo Wang) , 金良伟 , 阿米特·萨本 , 安迪·戴维斯 , 贝尔金·伊尔贝伊 , 布莱克·赫奇曼 , 陈德豪 , 卡提克·斯里尼瓦萨·穆尔西 , 马塞洛·马吉奥尼 , 乔张(音译) , 萨米尔·库马尔 , 郭同飞 , 徐元忠 , 周宗伟 :
通过大型深度学习模型中的分解与相关计算进行重叠通信。 ASPLOS(1) 2023 : 93-106 2021 [第17条] Phitchaya Mangpo Phothilimthana公司 , 阿米特·萨本 , 尼基尔·萨达 , 卡提克·斯里尼瓦萨·穆尔西 , Yanqi Zhou公司 , 克里斯托夫·安格穆勒 , 迈克·伯罗斯 , 苏迪普·罗伊 , 凯坦·曼克 , 雷萨·法拉哈尼 , 于爱玛·王 , 贝尔金·伊尔贝伊 , 布莱克·赫奇曼 , 比亚克·鲁恩 , 沈旺(Shen Wang) , 徐元忠 , 塞缪尔·考夫曼 :
一种灵活的自动调整多通道机器学习编译器的方法。 协定 2021 : 1-16 [第16条] 塞缪尔·考夫曼 , Phitchaya Mangpo Phothilimthana公司 , Yanqi Zhou公司 , 查里斯·门迪斯 , 苏迪普·罗伊 , 阿米特·萨本 , 迈克·伯罗斯 :
张量处理单元的学习性能模型。 MLSys公司 2021 2020 【j4】 斯瓦加特·文卡塔拉马尼 , 维维克·乔伊·科日科图 , 阿米特·萨本 , 考希克·罗伊 , 阿南德·拉胡纳坦 :
近似电路的逻辑综合。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 39 ( 10 ) : 2503-2515 ( 2020 ) [第15条] 卡纳克·马哈迪克 , 吴庆云 , 帅丽 , 阿米特·萨本 :
在线推荐系统的快速分布式盗贼。 内部控制系统 2020 : 4:1-4:13 [i2] 卡纳克·马哈迪克 , 吴清云 , 帅丽 , 阿米特·萨本 :
在线推荐系统的快速分布式盗贼。 CoRR公司 abs/2007.08061 ( 2020 )
2010 – 2019
2019 [j3] Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
协处理器的比较分析。 同意。 计算。 实际。 支出。 31 ( 1 ) ( 2019 ) [注2] Tsung Tai Yeh(宗大业) , 阿米特·萨本 , 普特·萨克德纳格尔 , 鲁道夫·艾根曼 , 蒂莫西·罗杰斯 :
Pagoda:用于窄任务的GPU运行时系统。 ACM事务处理。 并行计算。 6 ( 4 ) : 21:1-21:23 ( 2019 ) [第14条] Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
通过注册降级优化GPU程序:海报。 PPoPP(PPoPP) 2019 : 405-406 [i1] Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
RegDem:通过共享内存寄存器溢出提高GPU性能。 CoRR公司 abs/1907.02894 ( 2019 ) 2017 [第13条] 阿米特·萨本 , 小王 , 谢尔曼·J·基斯纳 , 查尔斯·布曼 , 阿南德·拉胡纳坦 , 塞缪尔·米奇夫 :
GPU上基于模型的CT图像迭代重建。 PPoPP(PPoPP) 2017 : 207-220 [第12条] Tsung Tai Yeh(宗大业) , 阿米特·萨本 , Putt Sakdhnagool足球俱乐部 , 鲁道夫·艾根曼 , 蒂莫西·罗杰斯 :
宝塔:针对窄任务的细粒度GPU资源虚拟化。 PPoPP(PPoPP) 2017 : 221-234 [第11条] 小王 , 阿米特·萨本 , 普特·萨克德纳格尔 , 谢尔曼·J·基斯纳 , 查尔斯·布曼 , 塞缪尔·米奇夫 :
大规模并行3D图像重建。 联合国安全理事会 2017 : 三 2016 [第10条] Tsung Tai Yeh(宗大业) , 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 , 蒂莫西·罗杰斯 :
海报:宝塔:在有限并行性的数据并行任务中最大化GPU利用率的运行时系统。 协定 2016 : 449-450 【c9】 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 :
结构化控制流图的形式化。 LCPC公司 2016 : 153-168 【c8】 小王 , 阿米特·萨本 , 谢尔曼·J·基斯纳 , 阿南德·拉古纳坦 , 查尔斯·布曼 , 塞缪尔·米奇夫 :
基于高性能模型的图像重建。 PPoPP公司 2016 : 2:1-2:12 2015 [j1] 阿米特·萨本 , Putt Sakdhnagool足球俱乐部 , 李赛永(Seyong Lee) , 杰弗里·维特 :
理解当代异构体系结构上高级编程模型的可移植性。 IEEE微型 35 ( 4 ) : 48-58 ( 2015 ) 【c7】 阿米特·萨本 , Putt Sakdhnagool足球俱乐部 , 鲁道夫·艾根曼 :
HeteroDoop:加速器集群的MapReduce编程系统。 高压直流电 2015 : 235-246 【c6】 Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
HYDRA:为加速器集群扩展共享地址编程。 液晶显示器 2015 : 140-155 2014 【c5】 阿米特·萨本 , Putt Sakdhnagool推杆 , 李赛永(Seyong Lee) , 杰弗里·维特 :
评估OpenACC的性能可移植性。 LCPC公司 2014 : 51-66 2013 【c4】 阿米特·萨本 , Putt Sakdhnagool足球俱乐部 , 鲁道夫·艾根曼 :
在多GPU加速器上缩放大数据计算。 内部控制系统 2013 : 443-454 2012 【c3】 Swagath文卡塔拉马尼 , 阿米特·萨本 , 维维克·乔伊·科日科图 , 考希克·罗伊 , 阿南德·拉胡纳坦 :
SALSA:近似电路的系统逻辑综合。 数模转换器 2012 : 796-801 【c2】 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 :
OpenMP到CUDA转换中编译器优化的效果。 综合水管理计划 2012 : 169-181 2010 [c1] 阿米特·萨本 , 拉杰什·蒂瓦里 , 阿比吉特·施里瓦斯塔瓦 , 斯利瓦思·拉维 , 鲁宾·A·帕雷基 :
用于使用扫描压缩的设计的通用低功耗扫描链包装器。 悉尼威立雅运输公司 2010 : 135-140
合著者索引
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)