阿尼凯特·辛格
人员信息
优化列表
![笔记](https://dblp.dagstuhl.de/img/note-mark.dark.12x12.png)
2020年–今天
2024 [第九章] 法希姆·塔伊瓦尔 , 阿尼凯特·辛格 , 阿奇特·夏尔马 , 拉斐尔·拉斐洛夫 , 杰夫·施耐德 , 谢腾阳 , 斯特凡诺·埃蒙 , 切尔西-芬兰人 , 阿维拉尔·库马尔 :
LLM的偏好微调应利用次优的政策内数据。 CoRR公司 abs/2404.14367 ( 2024 ) 2023 【c6】 布里安娜·齐特科维奇 , 天河余 , 徐思春 , 彭旭 , 特德·肖 , 费霞 , 吴嘉林 , 保罗·沃尔哈特 , 斯特凡·韦尔克 , 阿扎安·瓦希德 , 全旺 , 文森特·范胡克 , Huong T.Tran公司 , 拉杜·索里科特 , 阿尼凯特·辛格 , 贾斯皮亚尔·辛格 , 皮埃尔·塞尔马内特 , 潘纳格·桑科蒂 , 格雷西娅·萨拉查 , 迈克尔·瑞欧 , 克里斯塔·雷曼 , 卡尼什卡·饶 , 卡尔·佩奇 , 伊戈尔·莫达奇 , 亨利克·米查勒夫斯基 , 姚璐 , 谢尔盖·莱文 , 丽莎李 , 曾伟爱德华·李 , 伊莎贝尔·利尔 , 邝裕恒(Yuheng Kuang) , 德米特里·卡拉什尼科夫 , 瑞安·朱利安 , 尼基尔·乔希 , 亚历克斯·伊尔潘 , 布莱恩·伊彻 , 茉莉花Hsu , 亚历山大·赫尔佐格 , 卡罗尔·豪斯曼 , 基尔萨娜·戈帕拉克里什南 , 《楚苑赋》 , 皮特·弗洛伦斯 , 切尔西-芬兰人 , 库马尔·阿维纳瓦·杜比 , 丹尼·德里斯 , 天力鼎 , 克日什托夫·马钦·乔罗曼斯基 , 席晨 , 叶夫根·切博塔 , 卡巴贾尔法官 , 诺亚·布朗 , 安东尼·布罗汉 , 蒙塞拉特·冈萨雷斯·阿里纳斯 , 韩可航 :
RT-2:视觉-语言-动作模型将网络知识传递给机器人控制。 CoRL公司 2023 : 2165-2183 【c5】 中本光彦 , 翟志刚(Simon Zhai) , 阿尼凯特·辛格 , Max Sobol马克 , 伊玛 , 切尔西-芬兰人 , 阿维拉尔·库马尔 , 谢尔盖·莱文 :
Cal-QL:用于高效在线微调的校准离线RL预培训。 NeurIPS公司 2023 【c4】 阿尼凯特·辛格 , 阿维拉尔·库马尔 , 全旺 , 叶夫根·切博塔 , 谢尔盖·莱文 :
ReDS:通过支持约束使用异构数据库数据集的脱机RL。 NeurIPS公司 2023 【c3】 阿维拉尔·库马尔 , 阿尼凯特·辛格 , 弗雷德里克·艾伯特 , 中本光彦 , 杨燕来 , 切尔西-芬兰人 , 谢尔盖·莱文 :
机器人的预训练:离线RL可以在大量试验中学习新任务。 机器人学:科学与系统 2023 [i8] 中本光彦 , 月香寨 , 阿尼凯特·辛格 , 马克斯·索博尔马克 , 伊玛 , 切尔西-芬兰人 , 阿维拉尔·库马尔 , 谢尔盖·莱文 :
Cal-QL:用于高效在线微调的校准离线RL预培训。 CoRR公司 abs/2303.05479 ( 2023 ) [i7] 安东尼·布罗汉 , 诺亚·布朗 , 卡巴贾尔法官 , 叶夫根·切博塔 , 席晨 , Krzysztof Choromanski公司 , 天力鼎 , 丹尼·德里斯 , 阿维纳瓦·杜比 , 切尔西-芬兰人 , 皮特·弗洛伦斯 , 《楚苑赋》 , 蒙特斯·冈萨雷斯竞技场 , 基尔萨娜·戈帕拉克里什南 , 韩可航 , 卡罗尔·豪斯曼 , 亚历山大·赫尔佐格 , 茉莉花Hsu , 布莱恩·伊彻 , 亚历克斯·伊尔潘 , 尼基尔·乔希 , 瑞安·朱利安 , 德米特里·卡拉什尼科夫 , 邝裕恒(Yuheng Kuang) , 伊莎贝尔·利尔 , 丽莎李 , 曾伟爱德华·李 , 谢尔盖·莱文 , 姚璐 , 亨利克·米查勒夫斯基 , 伊戈尔·莫达奇 , 卡尔·佩奇 , 卡尼什卡·饶 , 克里斯塔·雷曼 , 迈克尔·瑞欧 , 格雷西娅·萨拉查 , 潘纳·桑科蒂 , 皮埃尔·塞尔马内特 , 贾斯皮亚尔·辛格 , 阿尼凯特·辛格 , 拉杜·索里科特 , Huong T.Tran公司 , 文森特·范胡克 , 全旺 , 阿扎安·瓦希德 , 斯特凡·韦尔克 , 保罗·沃尔哈特 , 吴嘉林 , 费霞 , 特德·肖 , 彭旭 , 徐思春 , 天河余 , 布里安娜·齐特科维奇 :
RT-2:视觉-语言-动作模型将网络知识传递给机器人控制。 CoRR公司 abs/2307.15818 ( 2023 ) [i6] 切坦·巴特贾 , 德里克·郭 , 迪比亚·戈什 , 阿尼凯特·辛格 , 马南·托马尔 , 全旺 , 叶夫根·切博塔 , 谢尔盖·莱文 , 阿维拉尔·库马尔 :
通过价值功能预训练从互联网视频中获得机器人离线RL。 CoRR公司 abs/2309.13041 ( 2023 ) [i5] Open X.——体现协作 , 阿比谢克·帕达尔卡 , 橡子池 , 阿金基亚·贾因 , 亚历克斯·贝利 , 亚历山大·赫尔佐格 , 亚历克斯·伊尔潘 , 亚历山大·卡扎茨基 , 阿南特·拉吉 , 阿尼凯特·辛格 , 安东尼·布罗汉 , 安东宁·拉芬 , 阿扎安·瓦希德 , 本·伯吉斯·利默里克 , 比姆琼·金 , 伯恩哈德·舍尔科夫 , 布莱恩·伊彻 , 策武路 , 查尔斯·许 , 切尔西-芬兰人 , 徐晨峰 , 程驰 , 黄晨光 , 克里斯汀·陈 , Chuer锅 , 《楚苑赋》 , 科林·德文 , 丹尼·德里斯 , Deepak Pathak公司 , 德鲁夫·沙阿 , 迪特尔·比切勒 , 德米特里·卡拉什尼科夫 , 多尔萨·萨迪格 , 爱德华·约翰斯 , 费德里科·塞奥拉 , 费霞 , 弗里克·斯图尔普 , 周高岳 , Gaurav S.Sukhatme公司 , 乔塔姆·萨尔霍特拉 , 葛燕 , 朱利奥·希亚维 , 格雷戈里·卡恩 , 郝苏 , 豪舒芳 , 郝晨石 , 海尼·本·阿莫尔 , 亨里克·克里斯滕森 , Hiroki Furuta公司 , 霍默·沃克 , 红洁芳 , 伊戈尔·莫达奇 , 伊里贾·拉多萨沃维奇 , 等。 :
Open X-Embodiment:机器人学习数据集和RT-X模型。 CoRR公司 abs/2310.08864 ( 2023 ) 2022 【c2】 阿维拉尔·库马尔 , 乔伊·洪 , 阿尼凯特·辛格 , 谢尔盖·莱文 :
我应该运行离线强化学习还是行为克隆? ICLR公司 2022 [i4] 阿维拉尔·库马尔 , 乔伊·洪 , 阿尼凯特·辛格 , 谢尔盖·莱文 :
什么时候我们更喜欢离线强化学习而不是行为克隆? CoRR公司 abs/2204.05618 ( 2022 ) [i3] 阿维拉尔·库马尔 , 阿尼凯特·辛格 , 弗雷德里克·埃伯特 , 杨燕来 , 切尔西-芬兰人 , 谢尔盖·莱文 :
机器人预训练:离线RL可以从大量的测试中学习新任务。 CoRR公司 腹肌/2210.05178 ( 2022 ) [i2] 阿尼凯特·辛格 , 阿维拉尔·库马尔 , 全旺 , 叶夫根·切博塔 , 谢尔盖·莱文 :
具有真实数据集的脱机RL:异构性和支持约束。 CoRR公司 abs/2211.01052 ( 2022 ) 2021 【c1】 阿维拉尔·库马尔 , 阿尼凯特·辛格 , 斯蒂芬·田 , 切尔西-芬兰人 , 谢尔盖·莱文 :
离线无模型机器人强化学习的工作流。 CoRL公司 2021 : 417-428 [i1] 阿维拉尔·库马尔 , 阿尼凯特·辛格 , 斯蒂芬·田 , 切尔西-芬兰人 , 谢尔盖·莱文 :
离线无模型机器人强化学习的工作流。 CoRR公司 abs/2109.10813 ( 2021 )
合著者索引
![](https://dblp.dagstuhl.de/img/cog.dark.24x24.png)