森村哲郎(Tetsuro Morimura)
人员信息
优化列表
![笔记](https://dblp.uni-trier.de/img/note-mark.dark.12x12.png)
2020年–今天
2024 【i15】 尤金奈 , Ukyo本田 , 森村哲郎(Tetsuro Morimura) , 张培南 :
通过最小贝叶斯风险解码生成多样化和高质量的文本。 CoRR公司 abs/2401.05054 ( 2024 ) [第14条] 田中宗彦 , 安倍晋史 , Kaito Ariu公司 , 森村哲郎(Tetsuro Morimura) , 埃德加·西蒙·塞拉 :
返回对齐的决策变压器。 CoRR公司 abs/2402.03923 ( 2024 ) [i13] 大桥雅本 , Ukyo本田 , 森村哲郎(Tetsuro Morimura) , 尤金奈 :
最小贝叶斯风险译码的真分布逼近。 CoRR公司 abs/2404.00752 ( 2024 ) [i12] 尤金奈 , 森村哲郎(Tetsuro Morimura) , Kaito Ariu公司 , 安倍晋史 :
正则化N中最佳抽样以缓解针对语言模型对齐的奖励黑客攻击。 CoRR公司 abs/2404.01054 ( 2024 ) [i11] 森村哲郎(Tetsuro Morimura) , 坂本光贵 , 尤金奈 , 安倍晋史 , Kaito Ariu公司 :
筛选的直接首选项优化。 CoRR公司 abs/2404.13846 ( 2024 ) [i10] 王浩(Hao Wang) , 森村哲郎(Tetsuro Morimura) , Ukyo本田 , 川原大辅 :
基于编辑的非自回归神经机器翻译的强化学习。 CoRR公司 abs/2405.01280 ( 2024 ) 2023 [第九章] Riku Togashi公司 , 冈田达寿 , 大坂直人 , 森村哲郎(Tetsuro Morimura) :
安全协作筛选。 CoRR公司 abs/2306.05292 ( 2023 ) [i8] 下山昭 , 森村哲郎(Tetsuro Morimura) , 安倍晋史 , Toda Takamichi先生 , Yuta Tomomatsu公司 , 杉山正树 , 朝日亨托纳 , 阿祖马·尤基 , Hirotaka Ninomiya公司 :
为什么引导对话策略学习表现良好? 了解对抗性学习的作用及其替代方法。 CoRR公司 abs/2307.06721 ( 2023 ) [i7] 尤金奈 , 森村哲郎(Tetsuro Morimura) , Ukyo本田 :
文本生成中光束搜索和穷尽搜索的深度。 CoRR公司 abs/2308.13696 ( 2023 ) [i6] Satoshi Hayakawa先生 , 森村哲郎(Tetsuro Morimura) :
带核求积的策略梯度。 CoRR公司 abs/2310.14768 ( 2023 ) [i5] 尤金奈 , 森村哲郎(Tetsuro Morimura) , Ukyo本田 , Kaito Ariu公司 , 安倍晋史 :
基于模型的最小贝叶斯风险解码。 CoRR公司 腹肌/2311.05263 ( 2023 ) 2022 [i4] 森村哲郎(Tetsuro Morimura) , 大田和弘 , 安倍晋史 , 张培南 :
非马尔科夫决策过程的蒙特卡罗树搜索策略梯度算法。 CoRR公司 abs/2206.01011 ( 2022 )
2010 – 2019
2019 [i3] 亚奇科·奥巴拉 , 森村哲郎(Tetsuro Morimura) , 柳泽弘(Hiroki Yanagisawa) :
马尔可夫链蒙特卡罗合成比采样器。 CoRR公司 abs/1906.06663 ( 2019 ) [i2] 赵坤 , Takayuki Osogami公司 , 森村哲郎(Tetsuro Morimura) :
具有重大事件和马尔可夫奖励过程的团队入侵运动的可视化分析。 CoRR公司 abs/1907.01221 ( 2019 ) 2017 [j5] Tsuyoshi Idé , Takayuki Katsuki先生 , 森村哲郎(Tetsuro Morimura) , 罗伯特·J·T·莫里斯 :
利用有限数量的低质量摄像头估算全市交通流量。 IEEE传输。 智力。 运输。 系统。 18 ( 4 ) : 950-959 ( 2017 ) 【j4】 Takayuki Katsuki先生 , 森村哲郎(Tetsuro Morimura) , 井上正人 :
根据车辆计数序列估计交通速度。 IEEE传输。 智力。 运输。 系统。 18 ( 7 ) : 1700-1712 ( 2017 ) 2016 [公元22年] 佐藤大辅 , 森村哲郎(Tetsuro Morimura) , 加藤隆之 , 丰田优介 , 加藤筑州 , Hironobu Takagi公司 :
通过触摸屏手势为新手老年用户提供自动帮助系统。 ICPR公司 2016 : 3073-3078 【c21】 Takayuki Katsuki先生 , 森村哲郎(Tetsuro Morimura) , Tsuyoshi Idé :
无监督物体计数,无物体识别。 ICPR公司 2016 : 3627-3632 [公元20年] Yasunori Yamada公司 , 森村哲郎(Tetsuro Morimura) :
深度神经网络预测未来模型性能的权重特征。 国际JCAI 2016 : 2231-2237 2015 [第19条] 原原聪 , 森村哲郎(Tetsuro Morimura) , 高桥俊弘 , 柳泽弘(Hiroki Yanagisawa) , 铃木太极 :
基于图的异常定位的一致性方法。 AISTATS公司 2015 [第18条] Rikiya Takahashi高桥 , 森村哲郎(Tetsuro Morimura) :
通过高斯过程不确定性规避预测偏好反转。 AISTATS公司 2015 2014 [第17条] 森村哲郎(Tetsuro Morimura) , Takayuki Osogami公司 , Tomoyuki Shirai先生 :
混合时间规则化策略梯度。 AAAI公司 2014 : 1997-2003 [第16条] Bin Tong先生 , 森村哲郎(Tetsuro Morimura) , 铃木Einoshin , Tsuyoshi Idé :
相关系统的概率二级异常检测。 ECAI公司 2014 : 1109-1110 [第15条] 原原聪 , 鲁迪·雷蒙德 , 森村哲郎(Tetsuro Morimura) , Hidemasa Muta公司 :
模拟中途预测:使用基于代理的模拟的中间特性进行早期场景评估。 WSC公司 2014 : 334-343 [第14条] 木塔秀马 , 鲁迪·雷蒙德 , 原原聪 , 森村哲郎(Tetsuro Morimura) :
使用模拟中间特征的多目标遗传算法。 WSC公司 2014 : 793-804 [第13条] 前田久美子 , 森村哲郎(Tetsuro Morimura) , Takayuki Katsuki先生 , Masayoshi Teraguchi先生 :
使用低分辨率网络摄像头和交通流量估算进行节俭的信号控制。 WSC公司 2014 : 2082-2091 2013 [第12条] 森村哲郎(Tetsuro Morimura) , 大谷隆之 , Tsuyoshi Idé :
部分观测马尔可夫链逆问题的求解。 NIPS公司 2013 : 1655-1663 2012 [第11条] Takayuki Osogami公司 , 森村哲郎(Tetsuro Morimura) :
优化问题的时间一致性。 AAAI公司 2012 : 1945-1953 [第10条] 鲁迪·雷蒙德 , 森村哲郎(Tetsuro Morimura) , Takayuki Osogami公司 , Noriaki Hirosue公司 :
基于隐马尔可夫模型的采样路网地图匹配。 ICPR公司 2012 : 2242-2245 【c9】 森村哲郎(Tetsuro Morimura) , 盛加藤 :
具有多个源的统计原点生成。 ICPR公司 2012 : 3443-3446 【c8】 Hido昭平 , 森村哲郎(Tetsuro Morimura) :
时间序列预测的时间特征选择。 ICPR公司 2012 : 3557-3560 【c7】 Rikiya Takahashi高桥 , Takayuki Osogami公司 , 森村哲郎(Tetsuro Morimura) :
车辆行程时间分布的大尺度非参数估计。 传感和诊断模块 2012 : 12-23 [i1] 森村哲郎(Tetsuro Morimura) , 杉山正树 , Hisashi鹿岛 , Hirotaka Hachiya公司 , 田中俊彦 :
强化学习的参数回归密度估计。 CoRR公司 abs/1203.3497 ( 2012 ) 2010 [j3] 杉山正树 , Hirotaka Hachiya公司 , Hisashi鹿岛 , 森村哲郎(Tetsuro Morimura) :
最小绝对策略迭代——一种稳健的值函数逼近方法。 IEICE传输。 信息系统。 93天 ( 9 ) : 2555-2565 ( 2010 ) [注2] 森村哲郎(Tetsuro Morimura) , 内野英二 , 吉本纯一郎 , 简·彼得斯 , Kenji Doya公司 :
用于策略梯度强化学习的对数平稳分布导数。 神经计算。 22 ( 2 ) : 342-376 ( 2010 ) 【c6】 森村哲郎(Tetsuro Morimura) , 杉山正树 , Hisashi鹿岛 , Hirotaka Hachiya公司 , 田中俊彦 :
强化学习的非参数回归分布近似。 ICML公司 2010 : 799-806 【c5】 森村哲郎(Tetsuro Morimura) , 杉山正树 , Hisashi鹿岛 , Hirotaka Hachiya公司 , 田中俊彦 :
强化学习的参数回归密度估计。 阿拉伯联合酋长国 2010 : 368-375 【c4】 松原隆明 , 森村哲郎(Tetsuro Morimura) , 森本俊(Jun Morimoto) :
具有平均奖励指标的自适应步长政策梯度。 ACML公司 2010 : 285-298
2000 – 2009
2009 【c3】 杉山正树 , Hirotaka Hachiya公司 , Hisashi鹿岛 , 森村哲郎(Tetsuro Morimura) :
稳健值函数逼近的最小绝对策略迭代。 ICRA公司 2009 : 2904-2909 【c2】 森村哲郎(Tetsuro Morimura) , 内野英二 , 吉本纯一郎 , Kenji Doya公司 :
一种广义自然行动者批判算法。 NIPS公司 2009 : 1312-1320 2008 [j1] 森村哲郎(Tetsuro Morimura) , 内野英二 , Kenji Doya公司 :
具有基线调整以减少差异的自然关键因素。 Artif公司。 生命机器人 13 ( 1 ) : 275-279 ( 2008 ) 【c1】 森村哲郎(Tetsuro Morimura) , 内野英二 , 吉本纯一郎 , Kenji Doya公司 :
基于平稳分布度量的新自然政策梯度。 ECML/PKDD(2) 2008 : 82-97
合著者索引
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)