停止战争！

Остановите войну!

对于科学家：

默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

桑巴亚尔·苏赫巴托

>主页 >珀森斯

人员信息

优化列表

优化激活！

放大了??属于??记录

查看优化列表

导出优化列表为

显示全部 ??记录

2020年–今天

请参阅常见问题解答

出版物列表中的颜色是什么意思？

2024
[公元36年]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2401-10020
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2401-10020
魏哲远,理查德·袁哲·庞,Kyunghyun Cho（赵京贤）,桑巴亚尔·苏赫巴托,景旭,杰森·韦斯顿:
自我奖励语言模型。 CoRR公司 abs/2401.10020(2024)
[i35]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-14083
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-14083
卢卡斯·莱纳特,桑巴亚尔·苏赫巴托,保罗·麦克维,迈克尔·拉巴特,田远东:
超越A*：通过搜索动态引导更好地规划变形金刚。 CoRR公司 abs/2402.14083(2024)
[i34]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2403-04642
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2403-04642
亚历克斯·哈夫里拉,杜玉清,莎拉·钱德拉·拉帕西,克里斯托弗罗斯·纳姆潘提斯,Jane Dwivedi-Yu,马克西姆·朱拉文斯基,埃里克·汉布罗,桑巴亚尔·苏赫巴托,罗伯塔·雷利亚努:
通过强化学习教授大型语言模型进行推理。 CoRR公司 abs/2403.04642(2024)
[i33]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2403-07816
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2403-07816
桑巴亚尔·苏赫巴托,奥尔加·戈洛夫涅娃,瓦苏·夏尔马,胡旭,西维多利亚·林,巴普蒂斯特·罗齐埃,雅各布·卡恩,丹尼尔·李,Wen-tau Yih先生,杰森·韦斯顿,西安丽:
分支训练MiX：将专家LLM混合为专家LLM的混合物。 CoRR公司腹肌/2403.07816(2024)
[i32]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2403-13799
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2403-13799
奥尔加·戈洛夫涅娃,泽源阿连珠,杰森·韦斯顿,桑巴亚尔·苏赫巴托:
反向训练护理反向诅咒。 CoRR公司 abs/2403.13799(2024)
[i31]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2404-19733
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2404-19733
理查德·袁哲·庞,魏哲远,Kyunghyun Cho（赵京贤）,呵呵呵呵,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
迭代推理偏好优化。 CoRR公司 abs/2404.19733(2024)
2023
[公元20年]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/LanchantinSSSS23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/LanchantinSSSSS23
杰克·兰坎廷,桑巴亚尔·苏赫巴托,加布里埃尔·辛纳维,孙宇轩,卡维亚·斯里尼特,亚瑟·斯拉姆:
用于推理具体代理的数据源。 AAAI公司 2023:8438-8446
[第19条]
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/acl/AdolphsGX0SW23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/acl/AdolphsGX0SW23
伦纳德·阿道夫,天宇高,景旭,库尔特·舒斯特,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
疯狂的失落：学习不应该模仿的语言。 ACL（1） 2023:8854-8874
[第18条]
- 看法
  - 电子版@nips.c（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/LanchantinTWSS23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/LanchantinTWSS23
杰克·兰坎廷,舒巴姆·托什尼瓦尔,杰森·韦斯顿,亚瑟·斯拉姆,桑巴亚尔·苏赫巴托:
学会用自我笔记进行推理和记忆。 NeurIPS公司 2023
[i30]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2301-02099
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2301-02099
利娜·梅兹加尼,桑巴亚尔·苏赫巴托,彼得亚·博亚诺夫斯基,亚历山德罗·拉扎里奇,卡提克·阿拉哈里:
通过自我监督的奖励塑造离线学习目标约束政策。 CoRR公司 abs/2301.02099(2023)
[i29]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2302-08063
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2302-08063
拉加夫·戈亚尔,埃夫罗西尼·马夫鲁迪,西通杨,桑巴亚尔·苏赫巴托,列奥尼德·西格尔,马特·费兹利,洛伦佐·托雷萨尼,杜Tran:
MINOTAUR：基于多模式查询的多任务视频接地。 CoRR公司 abs/2302.08063(2023)
[i28]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2304-11063
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2304-11063
利娜·梅兹加尼,彼得亚·博亚诺夫斯基,卡提克·阿拉哈里,桑巴亚尔·苏赫巴托:
三思而后行：语言推理与行动相结合的统一政策。 CoRR公司 abs/2304.11063(2023)
[i27]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2305-00833
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2305-00833
杰克·兰坎廷,舒巴姆·托什尼瓦尔,杰森·韦斯顿,亚瑟·斯拉姆,桑巴亚尔·苏赫巴托:
学会用自我笔记进行推理和记忆。 CoRR公司 abs/2305.00833(2023)
[i26]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日志/corr/abs-2305-05364
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2305-05364
伊马诺·施拉格,桑巴亚尔·苏赫巴托,阿斯利·塞利基尔马兹,Wen-tau Yih先生,杰森·韦斯顿,尤根·施密杜贝尔（Jürgen Schmidhuber）,西安丽:
大型语言模型程序。 CoRR公司 abs/2305.05364(2023)
[i25]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 轴颈/cor/abs-2306-04707
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2306-04707
景旭,大举,约书亚巷,Mojtaba Komeili公司,埃里克·迈克尔·史密斯,梅根·昂,莫特扎·贝罗兹,威廉·扬,拉舍尔·莫里茨,桑巴亚尔·苏赫巴托,Y-Lan Boureau公司,杰森·韦斯顿,库尔特·舒斯特:
通过从有机互动中学习来改进开放式语言模型。 CoRR公司 abs/2306.04707(2023)
【i24】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2309-07974
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2309-07974
杰克·兰坎廷,桑巴亚尔·苏赫巴托,加布里埃尔·辛纳芙,孙宇轩,卡维亚·斯里尼特,亚瑟·斯拉姆:
用于推理具体化代理的数据源。 CoRR公司 abs/2309.07974(2023)
[第23条]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2311-11829
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2311-11829
杰森·韦斯顿,桑巴亚尔·苏赫巴托:
System 2 Attention（系统2注意）（这也是您可能需要的）。 CoRR公司 abs/2311.11829(2023)
[i22]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2312-16682
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2312-16682
景旭,安德鲁李,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
有些事情比其他事情更危险：偏好优化和成对CRINGE损失。 CoRR公司 abs/2312.16682(2023)
2022
[第17条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/corl/MezghaniSBLA22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/corl/MezghaniSBLA22
利娜·梅兹加尼,桑巴亚尔·苏赫巴托,彼得亚·博亚诺夫斯基,亚历山德罗·拉扎里奇,卡提克·阿拉哈里:
通过自我监督的奖励塑造离线学习目标约束政策。 CoRL公司 2022:1401-1410
[第16条]
- 看法
  - 电子版@aclantology.org（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/ijcnlp/AroraSSW22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/ijcnlp/AroraSSW22
库沙尔·阿罗拉,库尔特·舒斯特,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
主任：用于监督语言建模的生成器分类器。 AACL/IJCNLP（1） 2022:512-526
[第15条]
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/iros/MezghaniSLMBA22公司
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iros/MezghaniSLMBBA22
利娜·梅兹加尼,桑巴亚尔·苏赫巴托,蒂博特·拉夫里尔,Oleksandr Maksymets公司,德鲁夫·巴特拉,彼得亚·博亚诺夫斯基,卡提克·阿拉哈里:
图像目标导航的记忆增强强化学习。 IROS公司 2022:3316-3323
[第14条]
- 看法
  - 电子版@nips.c（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/JuRSW22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/JuRSW22
大举,斯蒂芬·罗勒,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
序列递归处理的楼梯注意事项。 NeurIPS公司 2022
[第13条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/uai/ErraqabiMZSLDB22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/uai/ErraqabiMZSLDB22
阿克拉姆·埃拉卡比,马洛斯·马查多,赵明德,桑巴亚尔·苏赫巴托,亚历山德罗·拉扎里克,卢多维克·德诺耶尔,本吉奥:
时间抽象-增强时间对比学习：RL中拉普拉斯学习的替代方法。阿拉伯联合酋长国 2022:641-651
【i21】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2203-11369
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2203-11369
阿克拉姆·埃拉卡比,马洛斯·马查多,赵明德,桑巴亚尔·苏赫巴托,亚历山德罗·拉扎里奇,卢多维克·德诺耶尔,本吉奥:
时间抽象——增强的时间对比学习：RL中拉普拉斯学习的替代方法。 CoRR公司 abs/2203.11369(2022)
[i20]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2206-07694
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-07694
库沙尔·阿罗拉,库尔特·舒斯特,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
导演：受监督语言建模的生成器-分类器。 CoRR公司 abs/2206.07694(2022)
[i19]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2206-11733
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-11733
利娜·梅兹加尼,桑巴亚尔·苏赫巴托,彼得亚·博亚诺夫斯基,卡提克·阿拉哈里:
随机行走：学习在没有监督的情况下发现和实现目标。 CoRR公司 abs/2206.11733(2022)
[i18]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2211-05826
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2211-05826
伦纳德·阿道夫,天宇高,景旭,库尔特·舒斯特,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
疯狂的失落：学习不应该模仿的语言。 CoRR公司 abs/2211.05826(2022)
2021
[第12条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/SukhbaatarJPRSW21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/SukhbaatarJPRSW21
桑巴亚尔·苏赫巴托,大举,斯潘塞·波夫,斯蒂芬·罗勒,亚瑟·斯拉姆,杰森·韦斯顿,安吉拉·范:
并非所有的记忆都是平等的：学会通过过期来忘记。 ICML公司 2021:9902-9912年
[第11条]
- 看法
  - 电子版@neurips.cc（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/辊SSW21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/RollerSSW21
斯蒂芬·罗勒,桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,杰森·韦斯顿:
大型稀疏模型的散列层。 NeurIPS公司 2021:17555-17566
[i17]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2101-05181
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2101-05181
利娜·梅兹加尼,桑巴亚尔·苏赫巴托,蒂鲍特·拉夫里尔,Oleksandr Maksymets公司,德鲁夫·巴特拉,彼得亚·博亚诺夫斯基,卡提克·阿拉哈里:
图像目标导航的记忆增强强化学习。 CoRR公司 abs/2101.05181(2021)
[i16]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2105-06548
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2105-06548
桑巴亚尔·苏赫巴托,Da Ju公司,斯宾塞·波夫,斯蒂芬·罗勒,亚瑟·斯拉姆,杰森·韦斯顿,安吉拉·范:
并非所有的记忆都是平等的：学会在过期时忘记。 CoRR公司 abs/2105.06548(2021)
【i15】
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2106-04279
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2106-04279
大举,斯蒂芬·罗勒,桑巴亚尔·苏赫巴托,杰森·韦斯顿:
序列递归处理的楼梯注意事项。 CoRR公司 abs/2106.04279(2021)
[第14条]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2106-04426
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2106-04426
斯蒂芬·罗勒,桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,杰森·韦斯顿:
大型稀疏模型的散列层。 CoRR公司 abs/2106.04426(2021)
2020
[i13]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2002-09402
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2002-09402
安吉拉·范,蒂博特·拉夫里尔,爱德华·格雷夫,阿尔曼·朱林,桑巴亚尔·苏赫巴托:
使用反馈存储器访问顺序变压器中的高级表示。 CoRR公司 abs/2002.09402(2020)
[i12]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2004-04954
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2004-04954
莉娜·梅兹加尼,桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,阿尔曼·朱林,彼得亚·博亚诺夫斯基:
学习在没有任何监督的情况下在真实感环境中进行视觉导航。 CoRR公司 abs/2004.04954(2020)

2010 – 2019

请参阅常见问题解答

出版物列表中的颜色是什么意思？

2019
[第10条]
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/acl/SukhbaatarGBJ19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/acl/SukhbatarGBJ19
桑巴亚尔·苏赫巴托,爱德华·格雷夫,彼得亚·博亚诺夫斯基,阿尔曼·朱林:
《变形金刚》中的自适应注意广度。 ACL（1） 2019:331-335
【c9】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/acl/GraveSBJ19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/acl/GraveSBJ19
爱德华·格雷夫,桑巴亚尔·苏赫巴托,彼得亚·博亚诺夫斯基,阿尔曼·朱林:
通过分段边缘化训练混合语言模型。 ACL（1） 2019:1477-1482
【c8】
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/新加坡JS19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/SinghJS19
阿曼普雷特·辛格,图沙贾因,桑巴亚尔·苏赫巴托:
学习何时在多智能体合作和竞争任务中进行大规模通信。 ICLR（海报） 2019
[i11]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1905-07799
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1905-07799
桑巴亚尔·苏赫巴托,爱德华·格雷夫,彼得亚·博亚诺夫斯基,阿尔曼·朱林:
《变形金刚》中的自适应注意广度。 CoRR公司 abs/1905.07799(2019)
[i10]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1907-01470
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1907-01470
桑巴亚尔·苏赫巴托,爱德华·格雷夫,纪尧姆·兰普尔,埃尔维·杰古,阿尔曼·朱林:
用持久记忆增强自我注意力。 CoRR公司 abs/1907.01470(2019)
2018
【b1】
- 看法
  - 电子版@nyu.edu
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - 博士/us/Sukhbatar18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/phd/us/Sukhbatar18
桑巴亚尔·苏赫巴托:
智力要素：记忆、沟通和内在动机。美国纽约大学，2018
【c7】
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/SukhbaatarLKSSF18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/SukhbaatarLKSSF18
桑巴亚尔·苏赫巴托,林泽民,伊利亚·科斯特里科夫,加布里埃尔·辛纳维,亚瑟·斯拉姆,罗布·弗格斯:
通过非对称自我游戏实现内在动机和自动课程。 ICLR（海报） 2018
【c6】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/ZhangSLSF18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/ZhangSLSF18
张晓燕,桑巴亚尔·苏赫巴托,亚当·莱勒,亚瑟·斯拉姆,罗布·弗格斯:
具有属性的组合规划。 ICML公司 2018:5837-5846
[i9]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1803-00512
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1803-00512
张晓燕,亚当·莱勒,桑巴亚尔·苏赫巴托,罗布·弗格斯,亚瑟·斯拉姆:
具有属性的可组合规划。 CoRR公司 abs/1803.00512(2018)
[i8]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1809-02031
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1809-02031
David Folqué,桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,琼·布鲁纳:
使用算术和几何属性进行规划。 CoRR公司 abs/1809.02031(2018)
[i7]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1811-09083
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1811-09083
桑巴亚尔·苏赫巴托,艾米莉·丹顿,亚瑟·斯拉姆,罗布·弗格斯:
分层强化学习中通过自我游戏嵌入学习目标。 CoRR公司 abs/1811.09083(2018)
[i6]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/cor/abs-1812-09755
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1812-09755
阿曼普雷特·辛格,图沙贾因,桑巴亚尔·苏赫巴托:
学习在多智能体协作和竞争任务中何时进行大规模沟通。 CoRR公司 abs/1812.09755(2018)
2017
[i5]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/SukhbaatarKSF17
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/SukhbaatarKSF17
桑巴亚尔·苏赫巴托,伊利亚·科斯特里科夫,亚瑟·斯拉姆,罗布·弗格斯:
通过非对称自我游戏实现内在动机和自动课程。 CoRR公司 abs/1703.05407(2017)
2016
【c5】
- 看法
- 出口记录
  dblp键：
  - conf/nips/SukhbaatarSF16
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/SukhbaatarSF16
桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,罗布·弗格斯:
使用Backpropagation学习多智能体通信。 NIPS公司 2016:2244-2252
[i4]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/SukhbaatarSF16
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/SukhbaatarSF16
桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,罗布·弗格斯:
使用Backpropagation学习多智能体通信。 CoRR公司 abs/1605.07736(2016)
2015
【c4】
- 看法
- 出口记录
  dblp键：
  - conf/nips/SukhbaatarSWF15
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/SukhbaatarSWF15
桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,杰森·韦斯顿,罗布·弗格斯:
端到端内存网络。 NIPS公司 2015:2440-2448
【c3】
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/SukhbaatarF14
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/SukhbaatarF14
桑巴亚尔·苏赫巴托,罗布·弗格斯:
利用深度神经网络从噪声标签中学习。 ICLR（车间） 2015
[i3]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/SukhbaatarSWF15
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/SukhbaatarSWF15
桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,杰森·韦斯顿,罗布·弗格斯:
弱监管内存网络。 CoRR公司 abs/1503.08895(2015)
[i2]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/SukhbaatarSSCF15
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/SukhbaatarSSCF15
桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,加布里埃尔·辛纳维,Soumith Chintala公司,罗布·弗格斯:
迷宫基地：从游戏中学习的沙盒。 CoRR公司 abs/1511.07401(2015)
[i1]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/更正/周TSSF15
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/ZhouTSSF15
周伯雷,田远东,桑巴亚尔·苏赫巴托,亚瑟·斯拉姆,罗布·弗格斯:
直观问答的简单基线。 CoRR公司腹肌/1512.02167(2015)
2013
【c2】
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1301-3323
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1301-3323
桑巴亚尔·苏赫巴托,Takaki Makino先生,川崎爱原:
自动筛选：学习从图像序列中改进图像特征的不变性。 ICLR（车间海报） 2013
2011
【c1】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - 期刊/jmlr/SukhbaatarMAC11
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/jmlr/SukhbaatarMAC第11页
桑巴亚尔·苏赫巴托,Takaki Makino先生,川崎爱原,Takashi Chikayama公司:
用深度信念网络稳健地生成人体运动的动态模式。 ACML公司 2011:231-246

合著者索引

请参阅常见问题解答

服务

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入，让他们变得活跃。此处的所有设置将在您的web浏览器中存储为cookie。有关更多信息查看我们的F.A.Q。