阿米特·萨本
人员信息
优化列表
2020年–今天
2023 [第18条] 王世波(Shibo Wang) , 金良伟 , 阿米特·萨本 , 安迪·戴维斯 , 贝尔金·伊尔贝伊 , 布莱克·赫奇曼 , 陈德豪 , 卡提克·斯里尼瓦萨·穆尔西 , 马塞洛·马吉奥尼 , 乔张(音译) , 萨米尔·库马尔 , 郭同飞 , 徐元忠 , 周宗伟 :
通过大型深度学习模型中的分解与相关计算进行重叠通信。 ASPLOS(1) 2023 : 93-106 2021 [第17条] Phitchaya Mangpo Phothilimthana公司 , 阿米特·萨本 , 尼基尔·萨达 , 卡提克·斯里尼瓦萨·穆尔西 , Yanqi Zhou公司 , 克里斯托夫·安格穆勒 , 迈克·伯罗斯 , 苏迪普·罗伊 , 凯坦·曼克 , 雷萨·法拉哈尼 , 于爱玛·王 , 贝尔金·伊尔贝伊 , 布莱克·赫奇曼 , 比亚克·鲁恩 , 沈旺(Shen Wang) , 徐元忠 , 塞缪尔·考夫曼 :
一种灵活的自动调整多通道机器学习编译器的方法。 PACT公司 2021 : 1-16 [c16] 塞缪尔·考夫曼 , Phitchaya Mangpo Phothilimthana公司 , Yanqi Zhou公司 , 查里斯·门迪斯 , 苏迪普·罗伊 , 阿米特·萨本 , 迈克·伯罗斯 :
张量处理单元的学习性能模型。 MLSys公司 2021 2020 【j4】 斯瓦加特·文卡塔拉马尼 , 维维克·乔伊·科日科图 , 阿米特·萨本 , 考希克·罗伊 , 阿南德·拉胡纳坦 :
近似电路的逻辑综合。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 39 ( 10 ) : 2503-2515 ( 2020 ) [c15] 卡纳克·马哈迪克 , 吴庆云 , 帅丽 , 阿米特·萨本 :
在线推荐系统的快速分布式盗贼。 内部控制系统 2020 : 4:1-4:13 [i2] 卡纳克·马哈迪克 , 吴清云 , 帅丽 , 阿米特·萨本 :
在线推荐系统的快速分布式盗贼。 CoRR公司 abs/2007.08061 ( 2020 )
2010 – 2019
2019 [j3] Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
协处理器的比较分析。 同意。 计算。 实际。 支出。 31 ( 1 ) ( 2019 ) [注2] Tsung Tai Yeh(宗大业) , 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 , 蒂莫西·罗杰斯 :
Pagoda:用于窄任务的GPU运行时系统。 ACM事务处理。 并行计算。 6 ( 4 ) : 21:1-21:23 ( 2019 ) [第14条] Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
通过注册降级优化GPU程序:海报。 PPoPP(PPoPP) 2019 : 405-406 [i1] Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
RegDem:通过共享内存寄存器溢出提高GPU性能。 CoRR公司 abs/1907.02894 ( 2019 ) 2017 [第13条] 阿米特·萨本 , 小王 , 谢尔曼·J·基斯纳 , 查尔斯·布曼 , 阿南德·拉胡纳坦 , 塞缪尔·米奇夫 :
GPU上基于模型的CT图像迭代重建。 PPoPP(PPoPP) 2017 : 207-220 [第12条] 宗太业 , 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 , 蒂莫西·罗杰斯 :
宝塔:针对窄任务的细粒度GPU资源虚拟化。 PPoPP(PPoPP) 2017 : 221-234 [第11条] 小王 , 阿米特·萨本 , Putt Sakdhnagool推杆 , 谢尔曼·J·基斯纳 , 查尔斯·布曼 , 塞缪尔·米奇夫 :
大规模并行3D图像重建。 联合国安全理事会 2017 : 三 2016 【b1】 阿米特·萨本 :
加速器计算的编程模型、编译器和运行时系统。 美国普渡大学, 2016 [第10条] Tsung Tai Yeh(宗大业) , 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 , 蒂莫西·罗杰斯 :
海报:Pagoda:一个在有限并行度的数据并行任务中最大限度地利用GPU的运行时系统。 PACT公司 2016 : 449-450 【c9】 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 :
结构化控制流图的形式化。 LCPC公司 2016 : 153-168 【c8】 小王 , 阿米特·萨本 , 谢尔曼·J·基斯纳 , 阿南德·拉胡纳坦 , 查尔斯·布曼 , 塞缪尔·米奇夫 :
基于高性能模型的图像重建。 PPoPP(PPoPP) 2016 : 2:1-2:12 2015 [j1] 阿米特·萨本 , Putt Sakdhnagool推杆 , 李赛永(Seyong Lee) , 杰弗里·维特尔 :
理解当代异构体系结构上高级编程模型的可移植性。 IEEE微型 35 ( 4 ) : 48-58 ( 2015 ) 【c7】 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 :
HeteroDoop:加速器集群的MapReduce编程系统。 高压直流电 2015 : 235-246 【c6】 Putt Sakdhnagool推杆 , 阿米特·萨本 , 鲁道夫·艾根曼 :
HYDRA:为加速器集群扩展共享地址编程。 LCPC公司 2015 : 140-155 2014 【c5】 阿米特·萨本 , Putt Sakdhnagool推杆 , 李赛永(Seyong Lee) , 杰弗里·维特尔 :
评估OpenACC的性能可移植性。 LCPC公司 2014 : 51-66 2013 【c4】 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 :
在多GPU加速器上缩放大型数据计算。 内部控制系统 2013 : 443-454 2012 【c3】 斯瓦加特·文卡塔拉马尼 , 阿米特·萨本 , 维维克·乔伊·科日科图 , 考希克·罗伊 , 阿南德·拉胡纳坦 :
SALSA:近似电路的系统逻辑综合。 数模转换器 2012 : 796-801 【c2】 阿米特·萨本 , Putt Sakdhnagool推杆 , 鲁道夫·艾根曼 :
OpenMP到CUDA转换中编译器优化的效果。 综合水管理计划 2012 : 169-181 2010 【c1】 阿米特·萨本 , 拉杰什·蒂瓦里 , 阿比吉特·施里瓦斯塔瓦 , 斯利瓦思·拉维 , 鲁宾·A·帕雷基 :
用于使用扫描压缩的设计的通用低功耗扫描链包装器。 悉尼威立雅运输公司 2010 : 135-140