停止战争！

Остановите войну!

对于科学家：

默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

川崎秋美

>主页 >珀森斯

人员信息

优化列表

优化激活！

放大了??属于??记录

查看优化列表

导出优化列表为

显示全部 ??记录

2020年–今天

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2024
[第11条]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/WachiHH24公司
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/WachiHH24网址
川崎秋美,桥本和太郎,桥本嘉祖以下为：
采用二进制反馈的长期安全强化学习。 AAAI公司 2024以下为：21656-21663
[第14条]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2401-03786
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2401-03786
川崎秋美,桥本和太郎,桥本嘉祖以下为：
采用二进制反馈的长期安全强化学习。 CoRR公司 abs/2401.03786(2024)
[i13]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-02025
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-02025
川崎秋美,荀申,隋亚南以下为：
安全强化学习中约束公式的调查。 CoRR公司腹肌/2402.02025(2024)
[i12]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2404-11049
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2404-11049
川崎秋美,Thien Q.Tran先生,李佐藤,Takumi Tanabe先生,秋本优平以下为：
约束语言模型策略优化的逐步对齐。 CoRR公司 abs/2404.11049(2024)
2023
[第10条]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/WachiHSH23公司
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/WachiHSH23网址
川崎秋美,桥本和太郎,荀申,桥本嘉祖以下为：
强化学习中的安全探索：广义公式和算法。 NeurIPS公司 2023
[i11]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日志/corr/abs-2308-05306
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2308-05306
桥本和太郎,桥本嘉祖,川崎秋美,荀申,岸田雅子,高井Shigemasa Takai以下为：
基于车载传感器数据的控制屏障函数贝叶斯元学习。 CoRR公司 abs/2308.05306(2023)
[i10]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2310-03225
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2310-03225
川崎秋美,桥本和太郎,荀申,桥本嘉祖以下为：
强化学习中的安全探索：广义公式和算法。 CoRR公司腹肌/2310.03225(2023)
[第九章]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-230-10076
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-230-10076
Keita Saito先生,川崎秋美,Koki Wataoka公司,友海秋本惠以下为：
大型语言模型偏好标注中的详细度偏差。 CoRR公司 abs/2310.10076(2023)
2021
【c9】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/acl/KimuraCOTAMWKG21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/acl/KimuraCOTAMWKG21
大木村,苏巴吉特·乔杜里,小野正树,Michiaki Tatsubori公司,Don Joven Agravante先生,阿西姆·穆纳瓦尔,川崎秋美,Ryosuke Kohita公司,亚历山大·格雷以下为：
LOA：基于文本的互动游戏的逻辑优化动作。 ACL（演示） 2021以下为：227-231
【c8】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/acl/KohitaWKCTM21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/acl/KohitaWKCTM21
Ryosuke Kohita公司,川崎秋美,大木村,苏巴吉特·乔杜里,Michiaki Tatsubori公司,阿西姆·穆纳瓦尔以下为：
强化学习代理的基于语言的通用操作模板。 ACL/IJCNLP（调查结果） 2021以下为：2125-2139
【c7】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 会议/会议/岩本KW21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/conll/IwamotoKW21
岩本郎（Ran Iwamoto）,Ryosuke Kohita公司,川崎秋美以下为：
极性嵌入。 CoNLL公司 2021以下为：470-480
【c6】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/emnlp/KimuraOCKWATMG21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/emnlp/KimuraOCKWATMG21
大木村,小野正树,苏巴吉特·乔杜里,Ryosuke Kohita公司,川崎秋美,Don Joven Agravante先生,Michiaki Tatsubori公司,阿西姆·穆纳瓦尔,亚历山大·格雷以下为：
基于一阶逻辑的神经符号强化学习。 EMNLP（1） 2021以下为：3505-3511
【c5】
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/WachiWS21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/WachiWS21
川崎秋美,云岳伟,延安穗以下为：
基于局部广义线性函数逼近的安全策略优化。 NeurIPS公司 2021以下为：20759年至20771年
[i8]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2103-02363
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2103-02363
大木村,苏巴吉特·乔杜里,川崎秋美,Ryosuke Kohita公司,阿西姆·穆纳瓦尔,Michiaki Tatsubori公司,亚历山大·格雷以下为：
利用逻辑神经网络强化外部知识学习。 CoRR公司 abs/2103.02363(2021)
[i7]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-210-10963
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-210-10963
大木村,小野正树,苏巴吉特·乔杜里,Ryosuke Kohita公司,川崎秋美,Don Joven Agravante先生,Michiaki Tatsubori公司,阿西姆·穆纳瓦尔,亚历山大·格雷以下为：
基于一阶逻辑的神经符号强化学习。 CoRR公司 abs/2110.10963(2021)
[i6]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-210-10973
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-210-10973
木村大树,苏巴吉特·乔杜里,小野正树,Michiaki Tatsubori公司,Don Joven Agravante先生,阿西姆·穆纳瓦尔,川崎秋美,Ryosuke Kohita公司,亚历山大·格雷以下为：
LOA：基于文本的互动游戏的逻辑优化动作。 CoRR公司 abs/2110.10973(2021)
[i5]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2111-04894
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2111-04894
川崎秋美,云岳伟,延安穗以下为：
局部广义线性函数逼近的安全策略优化。 CoRR公司 abs/2111.04894(2021)
2020
【c4】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/emnlp/KohitaWZT20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/emnlp/KohitaWZT20
Ryosuke Kohita公司,川崎秋美,杨钊,Ryuki Tachibana公司以下为：
基于编辑的无监督总结的Q-学习语言模型。 EMNLP（1） 2020以下为：470-484
【c3】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/WachiS20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/WachiS20
川崎秋美,延安穗以下为：
约束马尔可夫决策过程中的安全强化学习。 ICML公司 2020以下为：9797-9806年
[i4]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2008-06626
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2008-06626
川崎秋美,延安穗以下为：
约束马尔可夫决策过程中的安全强化学习。 CoRR公司 abs/2008.06626(2020)
[i3]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2010-04379
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2010-04379
Ryosuke Kohita公司,川崎秋美,杨钊,Ryuki Tachibana公司以下为：
基于编辑的无监督总结的Q-学习语言模型。 CoRR公司 abs/2010.04379(2020)

2010 – 2019

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2019
[c2]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/ijcai/Wachi19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/ijcai/Wachi19
川崎秋美以下为：
使用多智能体对抗性强化学习的基于规则的智能体故障场景生成器及其在自动驾驶中的应用。 IJCAI公司 2019以下为：6006-6012
[i2]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1903-10654
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1903-10654
川崎秋美以下为：
使用多智能体对抗强化学习的基于规则的智能体故障场景生成器及其在自动驾驶中的应用。 CoRR公司 abs/1903.10654(2019)
2018
【c1】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/WachiSYO18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/WachiSYO18
川崎秋美,延安穗,易松岳,小野正弘以下为：
使用高斯过程安全探索和优化约束MDP。 AAAI公司 2018以下为：6548-6556
[i1]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1809-04232
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1809-04232
川崎秋美,Hiroshi Kajino先生,阿西姆·穆纳瓦尔以下为：
基于时空高斯过程的时变安全马尔可夫决策过程的安全探索。 CoRR公司 abs/1809.04232(2018)

合著者索引

请参阅常见问题解答

服务

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入才能让他们活跃起来。此处的所有设置将在您的web浏览器中存储为cookie。有关更多信息查看我们的F.A.Q。