托尔·阿莫特
人员信息
隶属关系: 加拿大多伦多大学
其他同名人员
优化列表
2020年-今天
2023 [公元58年] 德瓦尔·沙阿 , 托尔·阿莫特 :
学习深度回归的标签编码。 ICLR公司 2023 [公元57年] 刘璐飞 , 穆罕默德·赛义德 , 袁海思周 , 戴维·格里戈扬 , 泰勒·诺维基 , 托尔·阿莫特 :
LumiBench:硬件光线跟踪的基准套件。 IISWC公司 2023 : 1-14 [c56] 德瓦尔·沙阿 , 杨宁峰 , 托尔·阿莫特 :
高能效实时运动规划。 国际标准协会 2023 : 57:1-57:17 [公元55年] 袁海思周 , 泰勒·诺维基 , 托尔·阿莫特 :
用于光线跟踪的树预取。 微型的 2023 : 742-755 [e4] 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 迈克尔·斯威夫特 :
2023年3月25日至29日,加拿大不列颠哥伦比亚省温哥华,第28届ACM编程语言和操作系统架构支持国际会议记录,第2卷,ASPLOS 2023。 ACM公司 2023 ,国际标准图书编号 978-1-4503-9916-6 [目录] [e3] 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 迈克尔·斯威夫特 :
2023年3月25日至29日,加拿大不列颠哥伦比亚省温哥华,第28届ACM编程语言和操作系统架构支持国际会议记录,第3卷,ASPLOS 2023。 ACM公司 2023 ,国际标准图书编号 978-1-4503-9918-0 [目录] [电子2] 托尔·阿莫特 , 迈克尔·斯威夫特 , 娜塔莉·恩赖特·杰格 :
2023年3月25日至29日,加拿大不列颠哥伦比亚省温哥华,第28届ACM编程语言和操作系统架构支持国际会议记录,第4卷,ASPLOS 2023。 ACM公司 2023 [目录] [i12] 德瓦尔·沙阿 , 托尔·阿莫特 :
学习深度回归的标签编码。 CoRR公司 abs/2303.02273 ( 2023 ) 2022 [公元54年] 德瓦尔·沙阿 , 子雨雪 , 托尔·阿莫特 :
回归网络的标签编码。 ICLR公司 2022 [公元53年] 乔纳森·S·卢 , 刘云鹏 , 文一宫 , 内加尔·戈里 , R.大卫·埃文斯 , 托尔·阿莫特 :
预测并消除加速稀疏训练中的冗余计算。 国际标准协会 2022 : 536-551 [第52条] 穆罕默德·赛义德 , 袁海思周 , 刘璐飞 , 泰勒·诺维基 , 托尔·阿莫特 :
Vulkan-Sim:用于光线跟踪的GPU架构模拟器。 微型的 2022 : 263-281 [电子1] 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 迈克尔·斯威夫特 :
2023年3月25日至29日,加拿大不列颠哥伦比亚省温哥华,第28届ACM编程语言和操作系统架构支持国际会议记录,第1卷,ASPLOS 2023。 ACM公司 2022 ,国际标准图书编号 978-1-4503-9915-9 [目录] [i11] 德瓦尔·沙阿 , 子雨雪 , 托尔·阿莫特 :
回归网络的标签编码。 CoRR公司 abs/2212.01927 ( 2022 ) 2021 [第51条] 刘璐飞 , 韦斯利·张 , 弗朗索瓦·德穆林 , 袁海思周 , 穆罕默德·赛义德 , 大卫·潘克雷茨 , 泰勒·诺维基 , 托尔·阿莫特 :
用于加速GPU光线跟踪的交点预测。 微型的 2021 : 709-723 [c50] 维杰·坎迪亚 , 斯科特·佩维尔 , 马哈茂德·哈里 , 潘俊瑞 , 阿莫·曼朱纳特 , 蒂莫西·罗杰斯 , 托尔·阿莫特 , 尼科斯·哈达维拉斯 :
AccelWattch:现代GPU的功率建模框架。 微型的 2021 : 738-753 [公元49年] R.大卫·埃文斯 , 托尔·阿莫特 :
AC-GC:有保证收敛的有损激活压缩。 NeurIPS公司 2021 : 27434-27448 [i10] 德瓦尔·沙阿 , 子雨雪 , 卡提克·帕塔比拉曼 , 托尔·阿莫特 :
描述和提高自主机器人加速器的弹性。 CoRR公司 abs/2110.08906 ( 2021 ) 2020 [公元18年] 米拉德·穆罕默德 , 宋汉 , Ehsan Atoofian公司 , 阿米拉利·巴尼亚萨迪 , 托尔·阿莫特 , 威廉·戴利 :
能效随需动态分支预测模型。 IEEE传输。 计算机 69 ( 三 ) : 453-465 ( 2020 ) [公元48年] 金智浩 , 赵桑纯(Sanghun Cho) , 明秀·鲁 , 阿里·巴霍达 , 托尔·阿莫特 , 约翰·金 :
高通量处理器芯片上网络的带宽瓶颈。 PACT公司 2020 : 157-158 [公元47年] 内加尔·戈里 , 托尔·阿莫特 :
重新发芽:重复使用稀疏的反向繁殖。 CVPR公司 2020 : 1545-1555 [公元46年] 马哈茂德·哈里 , 沈哲生 , 托尔·阿莫特 , 蒂莫西·罗杰斯 :
Accel-Sim:用于验证GPU建模的可扩展仿真框架。 国际标准协会 2020 : 473-486 [公元45年] R.大卫·埃文斯 , 刘璐飞 , 托尔·阿莫特 :
JPEG-ACT:通过基于变换的有损压缩加速深度学习。 国际标准协会 2020 : 860-873 [公元44年] 袁海思周 , 克里斯托弗·吴 , 谢林·卡特尔 , 杰里米·伊坦 , 马修·辛克莱 , 约瑟夫·迪瓦蒂 , 蒂莫西·罗杰斯 , 托尔·阿莫特 :
确定性原子缓冲。 微型的 2020 : 981-995 [公元43年] 阿米尔·拉伊汉博士 , 托尔·阿莫特 :
稀疏重量激活训练。 NeurIPS公司 2020 [第九章] Aamir Raihan先生 , 托尔·阿莫特 :
稀疏重量激活训练。 CoRR公司 abs/2001.01969 ( 2020 )
2010 – 2019
2019 [公元42年] 泰勒·希克林·赫瑟林顿 , 玛丽亚·卢贝佐夫 , 德瓦尔·沙阿 , 托尔·阿莫特 :
EDGE:事件驱动的GPU执行。 PACT公司 2019 : 337-353 [公元41年] 阿尤布·A·古布兰 , 托尔·阿莫特 :
祖母绿:SoC系统的图形建模。 国际标准协会 2019 : 169-182 [公元40年] Aamir Raihan先生 , 内加尔·戈里 , 托尔·阿莫特 :
建模支持深度学习加速器的GPU。 ISPASS程序 2019 : 79-92 [公元39年] 马哈茂德·哈里 , 阿克谢·贾恩 , 托尔·阿莫特 , 蒂莫西·罗杰斯 :
当代GPU存储系统的详细模型。 ISPASS公司 2019 : 141-142 [公元38年] 乔纳森·S·卢 , 德瓦尔·沙阿 , 苏奇塔·帕蒂 , Shaylin Cattell公司 , 张梦驰 , 阿姆鲁斯·桑杜帕特拉 , 克里斯托弗·吴 , 内加尔·戈里 , 马修·辛克莱 , 蒂莫西·罗杰斯 , 托尔·阿莫特 :
使用详细的GPU模拟器分析机器学习工作负载。 ISPASS公司 2019 : 151-152 [i8] 阿尤布·A·古布兰 , Felix Huang(费利克斯·黄) , 托尔·阿莫特 :
使用动态调色板的曲面压缩。 CoRR公司 腹肌/1903.06658 ( 2019 ) [i7] 弗朗索瓦·德穆林 , 阿尤布·A·古布兰 , 托尔·阿莫特 :
基于散列的射线路径预测:通过利用射线局部性跳过BVH遍历计算。 CoRR公司 abs/1910.01304 ( 2019 ) 2018 【b1】 托尔·阿莫特 , Wilson Wai Lun Fung先生 , 蒂莫西·罗杰斯 :
通用图形处理器体系结构。 计算机体系结构综合讲座 , 摩根克莱普尔出版社 2018 ,国际标准图书编号 978-3-031-00631-9 [公元17年] 安德烈亚斯·莫绍沃斯 , 豪尔赫·阿尔贝里西奥 , 帕特里克·贾德 , 阿尔贝托·德尔马斯·拉斯科兹 , 萨耶赫·谢里菲 , 齐西斯·普洛斯 , 泰勒·H·海瑟林顿 , 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 :
利用典型价值观加快深度学习。 电脑类 51 ( 5 ) : 18-30 ( 2018 ) [公元16年] 安德烈亚斯·莫绍沃斯 , 豪尔赫·阿尔布里西奥 , 帕特里克·贾德 , 阿尔贝托·德尔马斯·拉斯科兹 , 萨耶赫·谢里菲 , 泰勒·H·海瑟林顿 , 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 :
基于价值的深度学习加速。 IEEE微型 38 ( 1 ) : 41-55 ( 2018 ) [公元15年] 帕特里克·贾德 , 豪尔赫·阿尔贝里西奥 , 泰勒·H·海瑟林顿 , 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 拉奎尔·厄塔松 , 安德烈亚斯·莫绍沃斯 :
Proteus:利用深度神经网络中的精度可变性。 并行计算。 73 : 40-51 ( 2018 ) [公元37年] 艾哈迈德·埃尔坦塔维 , 托尔·阿莫特 :
细粒度同步的翘曲调度。 HPCA公司 2018 : 375-388 [公元36年] 安德烈亚斯·莫绍沃斯 , 豪尔赫·阿尔贝里西奥 , 帕特里克·贾德 , 阿尔贝托·德尔马斯 , 萨耶赫·谢里菲 , 穆斯塔法·马哈茂德 , 泰勒·H·海瑟林顿 , 米洛斯·尼科利奇 , 迪伦·马龙·斯图亚特 , 凯文·萧 , 齐西斯·普洛斯 , 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 :
识别和利用无效计算实现深度学习的硬件加速。 新WCAS 2018 : 356-360 [i6] 马哈茂德·哈里 , 阿克谢·贾恩 , 托尔·阿莫特 , 蒂莫西·罗杰斯 :
通过精确建模探索现代GPU存储系统设计挑战。 CoRR公司 abs/1810.07269 ( 2018 ) [i5] Aamir Raihan先生 , 内加尔·戈里 , 托尔·阿莫特 :
建模支持深度学习加速器的GPU。 CoRR公司 abs/1811.08309 ( 2018 ) [i4] 乔纳森·S·卢 , 德瓦尔·沙阿 , 苏奇塔·帕蒂 , 谢林·卡特尔 , 张梦驰 , 阿姆鲁斯·桑杜帕特拉 , 克里斯托弗·吴 , 内加尔·戈里 , 马修·辛克莱 , 蒂莫西·罗杰斯 , 托尔·阿莫特 :
使用详细的GPU模拟器分析机器学习工作负载。 CoRR公司 abs/1811.08933 ( 2018 ) 2017 [公元14年] 米拉德·穆罕默德 , 托尔·阿莫特 , 威廉·戴利 :
CG-OoO:能效高的粗粒无序执行近有序能量,近无序性能。 ACM事务处理。 阿奇特。 代码优化。 14 ( 4 ) : 39:1-39:26 ( 2017 ) [公元35年] 沙迪·阿萨迪霍马米 , 詹妮弗·旺科(Jennifer Ongko) , 托尔·阿莫特 :
用于高级综合的状态机块。 FPT公司 2017 : 80-87 [i3] 亚蒂什·图拉基亚 , 达氏Subhasis , 托尔·阿莫特 , 威廉·戴利 :
HoLiSwap:减少一级缓存中的线能量。 CoRR公司 abs/1701.03878 ( 2017 ) 2016 [j13] 李东东 , 托尔·阿莫特 :
核心间位置感知内存调度。 IEEE计算。 阿奇特。 莱特。 15 ( 1 ) : 25-28 ( 2016 ) [公元12年] Subhasis Das公司 , 托尔·阿莫特 , 威廉·戴利 :
重用基于距离的概率缓存替换。 ACM事务处理。 阿奇特。 代码优化。 12 ( 4 ) : 33:1-33:22 ( 2016 ) [公元34年] 帕特里克·贾德 , 豪尔赫·阿尔贝里西奥 , 泰勒·H·海瑟林顿 , 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 安德烈亚斯·莫绍沃斯 :
Proteus:利用深度神经网络中的数值精度可变性。 内部控制系统 2016 : 23:1-23:12 [公元33年] 豪尔赫·阿尔贝里西奥 , 帕特里克·贾德 , 泰勒·H·海瑟林顿 , 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 安德烈亚斯·莫绍沃斯 :
Cnvlutin:无影响神经元的深度神经网络计算。 国际标准协会 2016 : 1-13 [公元32年] 艾哈迈德·埃尔坦塔维 , 托尔·阿莫特 :
SIMT体系结构上的MIMD同步。 微型的 2016 : 11:1-11:14 [c31] 帕特里克·贾德 , 豪尔赫·阿尔贝里西奥 , 泰勒·H·海瑟林顿 , 托尔·阿莫特 , 安德烈亚斯·莫绍沃斯 :
条纹:位序列深层神经网络计算。 微型的 2016 : 19:1-19:12 [i2] 米拉德·穆罕默迪 , 托尔·阿莫特 , 威廉·戴利 :
CG-OoO:能效粗粒无序执行。 CoRR公司 abs/1606.01607 ( 2016 ) 2015 [公元11年] 米拉德·穆罕默德 , 宋汉 , 托尔·阿莫特 , 威廉·戴利 :
按需动态分支预测。 IEEE计算。 阿奇特。 莱特。 14 ( 1 ) : 50-53 ( 2015 ) [公元30年] 泰勒·H·海瑟林顿 , 奥康纳 , 托尔·阿莫特 :
MemcachedGPU:按比例扩展键值存储。 SoCC公司 2015 : 43-57 [公元29年] Subhasis Das公司 , 托尔·阿莫特 , 威廉·戴利 :
SLIP:减少内存层次结构中的布线能量。 国际标准协会 2015 : 349-361 [i1] 帕特里克·贾德 , 豪尔赫·阿尔贝里西奥 , 泰勒·H·海瑟林顿 , 托尔·阿莫特 , 娜塔莉·恩赖特·杰格 , 拉奎尔·厄塔松 , 安德烈亚斯·莫绍沃斯 :
深度神经网络中有限记忆的降低精度策略。 CoRR公司 abs/1511.05236 ( 2015 ) 2014 [公元10年] 蒂莫西·罗杰斯 , 奥康纳 , 托尔·阿莫特 :
了解您的限制:通过调度管理大规模多线程缓存。 Commun公司。 ACM公司 57 ( 12 ) : 91-98 ( 2014 ) [公元9年] Inderpreet Singh公司 , Arrvindh Shriraman公司 , 威尔逊·W·L·冯 , 奥康纳 , 托尔·阿莫特 :
GPU体系结构的缓存一致性。 IEEE微型 34 ( 三 ) : 69-79 ( 2014 ) [公元28年] 艾哈迈德·埃尔坦塔维 , 马文杰(Jessica Wenjie Ma) , 奥康纳 , 托尔·阿莫特 :
一种可扩展的多路径微体系结构,用于高效的GPU控制流。 HPCA公司 2014 : 248-259 [公元27年] 托尔·阿莫特 :
扩展可用计算能力。 ICSAMOS公司 2014 : 我 2013 [j8] 蒂莫西·罗杰斯 , 奥康纳 , 托尔·阿莫特 :
大规模多线程处理器的缓存一致性线程调度。 IEEE微型 33 ( 三 ) : 78-85 ( 2013 ) [j7] 阿里·巴霍达 , 约翰·金 , 托尔·阿莫特 :
为吞吐量加速器设计片上网络。 ACM事务处理。 阿奇特。 代码优化。 10 ( 三 ) : 21:1-21:35 ( 2013 ) [公元26年] 哈迪·乔伊巴尔 , 威尔逊·W·L·冯 , 奥康纳 , 约瑟夫·迪瓦蒂 , 托尔·阿莫特 :
GPUDet:确定性GPU体系结构。 ASPLOS公司 2013 : 1-12 [公元25年] 维塔利·扎卡伦科 , 托尔·阿莫特 , 安德烈亚斯·莫绍沃斯 :
使用FusionSim描述融合CPU/GPU系统的性能优势。 日期 2013 : 685-688 [公元24年] Inderpreet Singh公司 , Arrvindh Shriraman公司 , 威尔逊·W·L·冯 , 奥康纳 , 托尔·阿莫特 :
GPU体系结构的缓存一致性。 HPCA公司 2013 : 578-590 【c23】 镜文冷 , 泰勒·H·海瑟林顿 , 艾哈迈德·埃尔坦塔维 , 赛义德·佐哈伊布·吉拉尼 , 南宋金 , 托尔·阿莫特 , 维杰·贾纳帕·雷迪 :
GPU功率:在GPGPU中启用能量优化。 国际标准协会 2013 : 487-498 [公元22年] 蒂莫西·罗杰斯 , 奥康纳 , 托尔·阿莫特 :
差异软件偏差调度。 微型的 2013 : 99至110 【c21】 威尔逊·W·L·冯 , 托尔·阿莫特 :
通过时空优化的节能GPU事务内存。 微型的 2013 : 408-420 2012 [j6] Wilson Wai Lun Fung先生 , Inderpreet Singh公司 , 安德鲁·布朗斯剑 , 托尔·阿莫特 :
Kilo TM:用于GPU架构的硬件事务性内存。 IEEE微型 32 ( 三 ) : 7-16 ( 2012 ) [j5] Xi E.Chen先生 , 托尔·阿莫特 :
多程序多核处理器的缓存竞争和吞吐量建模。 IEEE传输。 计算机 61 ( 7 ) : 913-927 ( 2012 ) 【j4】 马塞尔·戈特 , 弗拉维奥·德·保拉 , Johnny J.W.宽 , 托尔·阿莫特 , 艾伦·J·胡 , 史蒂芬·J·E·威尔顿 , 金阳 :
基于形式分析的硅后调试跟踪计算。 IEEE传输。 超大规模集成电路。 系统。 20 ( 11 ) : 1997-2010 ( 2012 ) [公元20年] 吉米·夸 , 托尔·阿莫特 :
FPGA上通过块RAM共享的小型虚拟通道路由器。 FPT公司 2012 : 71至79 [第19条] 泰勒·H·海瑟林顿 , 蒂莫西·罗杰斯 , Lisa Hsu(丽莎·徐) , 奥康纳 , 托尔·阿莫特 :
描述和评估异类CPU-GPU系统上的键值存储应用程序。 ISPASS公司 2012 : 88-98 [第18条] 蒂莫西·罗杰斯 , 奥康纳 , 托尔·阿莫特 :
Cache-Consious Wavefront调度。 微型的 2012 : 72-83 [第17条] 强尼·J·W·宽 , 托尔·阿莫特 :
渐进式后台空间:用于硅后调试的高效前置处理器计算。 音乐电视 2012 : 70-75 2011 [j3] Xi E.Chen先生 , 托尔·阿莫特 :
未决缓存命中、数据预取和MSHR的混合分析建模。 ACM事务处理。 阿奇特。 代码优化。 8 ( 三 ) : 10:1-10:28 ( 2011 ) [第16条] 威尔逊·W·L·冯 , 托尔·阿莫特 :
实现高效SIMT控制流的线程块压缩。 HPCA公司 2011 : 25-36 [第15条] 威尔逊·W·L·冯 , Inderpreet Singh公司 , 安德鲁·布朗斯剑 , 托尔·阿莫特 :
GPU体系结构的硬件事务内存。 微型的 2011 : 296-307 2010 [第14条] 阿里·巴霍达 , 约翰·金 , 托尔·阿莫特 :
计算加速器的芯片上网络设计注意事项。 PACT公司 2010 : 535-536 [第13条] 亚伦·阿里尔 , 威尔逊·W·L·冯 , 安德鲁·特纳 , 托尔·阿莫特 :
可视化多核加速器架构中的复杂动力学。 ISPASS公司 2010 : 164-174 [第12条] 强尼·J·W·宽 , 史蒂文·J·E·威尔顿 , 托尔·阿莫特 :
加速硅后调试中的跟踪计算。 ISQED公司 2010 : 244-249 [第11条] 阿里·巴霍达 , 约翰·金 , 托尔·阿莫特 :
用于多核加速器的吞吐量有效的片上网络。 微型的 2010 : 421-432
2000 – 2009
2009 [注2] 威尔逊·W·L·冯 , 伊万·沙姆 , 乔治·L·袁 , 托尔·阿莫特 :
动态扭曲形成:SIMD图形硬件上的高效MIMD控制流。 ACM事务处理。 阿奇特。 代码优化。 6 ( 2 ) : 7点-7分37秒 ( 2009 ) [第10条] Xi E.Chen先生 , 托尔·阿莫特 :
一阶细粒度多线程吞吐量模型。 HPCA公司 2009 : 329至340 [c9] 阿里·巴霍达 , 乔治·L·袁 , 威尔逊·W·L·冯 , 王有邦 , 托尔·阿莫特 :
使用详细的GPU模拟器分析CUDA工作负载。 ISPASS公司 2009 : 163-174 【c8】 乔治·L·袁 , 阿里·巴霍达 , 托尔·阿莫特 :
多核加速器体系结构的复杂高效内存访问调度。 微型的 2009 : 34-44 2008 [j1] 托尔·阿莫特 , 保罗·周 :
用于提高浮点到定点转换精度的编译时和指令集方法。 ACM事务处理。 嵌入。 计算。 系统。 7 ( 三 ) : 26:1-26:27 ( 2008 ) 【c7】 王有邦 , 安妮·布雷西 , 伊桑·舒克曼 , 托尔·阿莫特 , 杰米森·D·柯林斯 , 佩里·H·王 , 高萨姆·N.钦亚 , 安库尔·坎德沃尔·格伦 , 洪江 , 王宏(Hong Wang) :
Pangaea:紧密耦合的IA32异构芯片多处理器。 PACT公司 2008 : 52-61 【c6】 Xi E.Chen先生 , 托尔·阿莫特 :
未决缓存命中、数据预取和MSHR的混合分析建模。 微型的 2008 : 59-70 2007 【c5】 托尔·阿莫特 , 保罗·周 :
使用基于路径表达式的统计建模优化数据预取帮助器线程。 内部控制系统 2007 : 210-221 【c4】 威尔逊·W·L·冯 , 伊凡·沙姆 , 乔治·L·袁 , 托尔·阿莫特 :
高效GPU控制流的动态扭曲形成和调度。 微型的 2007 : 407至420 2004 【c3】 托尔·阿莫特 , 保罗·周 , 佩尔·哈马伦德 , 王宏(Hong Wang) , 约翰·保罗·沈 :
预先指令预取的硬件支持。 HPCA公司 2004 : 84-95 2003 【c2】 托尔·阿莫特 , 佩德罗·马尔库略 , 保罗·周 , 安东尼奥·冈萨雷斯 , 佩尔·哈马伦德 , 王宏(Hong Wang) , 约翰·保罗·沈 :
预测指令预取的建模和优化框架。 SIGMETRICS公司 2003 : 13-24 2000 【c1】 托尔·阿莫特 , 保罗·周 :
嵌入式ISA支持增强的浮点到定点ANSI-C编译。 案例 2000 : 128-137