理查德·刘
人员信息
优化列表
2020年–今天
2022 [第11条] 罗米尔·巴德瓦吉 , 阿列克谢·图马诺夫 , 斯蒂芬妮·王 , 理查德·刘 , 菲利普·莫里茨 , 罗伯特·西原 , 离子斯托伊卡 :
ESCHER:利用短暂资源进行富有表现力的调度。 SoCC公司 2022 : 47-62 [第10条] 理查德·廖 , 佩奇·贝利 , 李颖 , 玛丽亚·迪马科普洛 , 伊夫·雷蒙德 :
第2022版:基于强化学习的大规模推荐系统。 RecSys系统 2022 : 684-685 2021 【c9】 丽莎·邓拉普 , 基尔蒂瓦桑·坎达萨米 , 乌伊瓦尔·米斯拉 , 理查德·刘 , 迈克尔·乔丹 , 离子石 , 约瑟夫·冈萨雷斯 :
云上的弹性超参数调整。 SoCC公司 2021 : 33-46 【c8】 乌伊瓦尔·米斯拉 , 理查德·刘 , 丽莎·邓拉普 , 罗米尔·巴德瓦吉 , 基尔蒂瓦桑·坎达萨米 , 约瑟夫·冈萨雷斯 , 离子斯托伊卡 , 阿列克谢·图马诺夫 :
RubberBand:基于云的超参数调整。 欧洲系统 2021 : 327-342 2020 【c7】 迈克尔·罗 , 姚佳豪 , 理查德·刘 , 埃里克·梁 , 离子斯托伊卡 :
IMPACT:具有剪裁目标网络的重要性加权异步体系结构。 ICLR公司 2020 [第九章] 理查德·刘 , 罗米尔·巴德瓦吉 , 丽莎·邓拉普 , 邹益田 , 约瑟夫·冈萨雷斯 , 离子斯托伊卡 , 阿列克谢·图马诺夫 :
HyperSched:在最后期限内为模型开发动态资源重新分配。 CoRR公司 abs/2001.02338 ( 2020 )
2010 – 2019
2019 [j1] 桑杰·克里希南 , 阿尼梅斯·加格 , 理查德·刘 , 布里延·塔南杰扬 , 劳伦·米勒 , 弗洛里安·T·波科尼 , 肯·戈德伯格 :
SWIRL:一种用于具有延迟奖励的机器人任务的顺序窗口反向强化学习算法。 国际机器人研究杂志。 38 ( 2-3 ) ( 2019 ) 【c6】 理查德·刘 , 罗米尔·巴德瓦吉 , 丽莎·邓拉普 , 邹益田 , 约瑟夫·冈萨雷斯 , 离子石 , 阿列克谢·图马诺夫 :
HyperSched:在最后期限内为模型开发动态资源重新分配。 SoCC公司 2019 : 61-73 [i8] 迈克尔·罗 , 姚佳豪 , 理查德·刘 , 埃里克·梁 , 离子斯托伊卡 :
IMPACT:具有剪裁目标网络的重要性加权异步体系结构。 CoRR公司 abs/1912.00167 ( 2019 ) 2018 【c5】 尤金·维尼茨基 , Aboudy Kreidieh公司 , 吕克·勒弗莱姆 , Nishant Kheterpal公司 , 凯西·张 , 胡家惠 , 吴芳雨 , 理查德·刘 , 埃里克·梁 , 亚历山大·巴彦 :
混合自治交通中强化学习的基准。 CoRL公司 2018 : 399-409 【c4】 埃里克·梁 , 理查德·刘 , 罗伯特·西原 , 菲利普·莫里茨 , 罗伊·福克斯 , 肯·戈德伯格 , 约瑟夫·冈萨雷斯 , 迈克尔·乔丹 , 离子斯托伊卡 :
RLlib:分布式强化学习的抽象。 ICML公司 2018 : 3059-3068 【c3】 菲利普·莫里茨 , 罗伯特·西原 , 斯蒂芬妮·王 , 阿列克谢·图马诺夫 , 理查德·刘 , Eric Liang(埃里克·梁) , 梅利赫·埃利博尔 , 杨宗衡 , 威廉保罗 , 迈克尔·乔丹 , 离子斯托伊卡 :
雷:新兴人工智能应用程序的分布式框架。 OSDI公司 2018 : 561-577 [i7] 理查德·刘 , 埃里克·梁 , 罗伯特·西原 , 菲利普·莫里茨 , 约瑟夫·冈萨雷斯 , 离子斯托伊卡 :
Tune:分布式模型选择和训练的研究平台。 CoRR公司 abs/1807.05118 ( 2018 ) 2017 【c2】 罗伯特·西原 , 菲利普·莫里茨 , 斯蒂芬妮·王 , 阿列克谢·图马诺夫 , 威廉保罗 , 约翰·施莱尔·史密斯 , 理查德·刘 , 梅赫达德·尼科纳米 , 迈克尔·乔丹 , 离子斯托伊卡 :
实时机器学习:缺失的部分。 热操作系统 2017 : 106-110 [i6] 罗伯特·西原 , 菲利普·莫里茨 , 斯蒂芬妮·王 , 阿列克谢·图马诺夫 , 威廉保罗 , 约翰·施莱尔·史密斯 , 理查德·刘 , 迈克尔·乔丹 , 离子斯托伊卡 :
实时机器学习:缺失的部分。 CoRR公司 abs/1703.03924 ( 2017 ) [i5] 迈克尔·拉斯基 , 乔纳森·李 , 谢伟思礼 , 理查德·刘 , 杰弗里·马勒 , 罗伊·福克斯 , 肯·戈德伯格 :
可缩放模拟学习的迭代噪声注入。 CoRR公司 abs/1703.09327 ( 2017 ) [i4] 理查德·廖 , 桑杰·克里希南 , 阿尼梅斯·加格 , 丹尼尔·克兰肖 , 约瑟夫·冈萨雷斯 , 肯·戈德伯格 :
使用分层深度强化学习制定自主驾驶元策略。 CoRR公司 abs/1711.01503 ( 2017 ) [i3] 菲利普·莫里茨 , 罗伯特·西原 , 斯蒂芬妮·王 , 阿列克谢·图马诺夫 , 理查德·刘 , 埃里克·梁 , 威廉保罗 , 迈克尔·乔丹 , 离子斯托伊卡 :
雷:新兴人工智能应用程序的分布式框架。 CoRR公司 abs/1712.05889 ( 2017 ) [i2] 埃里克·梁 , 理查德·廖 , 罗伯特·西原 , 菲利普·莫里茨 , 罗伊·福克斯 , 约瑟夫·冈萨雷斯 , 肯·戈德伯格 , 离子斯托伊卡 :
Ray RLLib:一个可组合和可扩展的强化学习库。 CoRR公司 abs/1712.09381 ( 2017 ) 2016 【c1】 桑杰·克里希南 , 阿尼梅斯·加格 , 理查德·廖 , 布里延·塔南杰扬 , 劳伦·米勒 , 弗洛里安·T·波科尼 , 肯·戈德伯格 :
SWIRL:一种用于奖励延迟机器人任务的序列窗口逆强化学习算法。 加权平均值 2016 : 672-687 [i1] 桑杰·克里希南 , 阿尼梅斯·加格 , 理查德·廖 , 劳伦·米勒 , 弗洛里安·T·波科尼 , 肯·戈德伯格 :
HIRL:用于奖励延迟的长期任务的分层反向强化学习。 CoRR公司 abs/1604.06508 ( 2016 )