×
作者ID: 于慧珍“俞慧珍”最近发表的zbMATH文章
发布日期: 于慧珍;于惠珍
已编制索引的文档: 26出版物自1991年以来,包括4个附加arXiv预打印
合著者: 12位合著者具有15份联合出版物
308合著作者

按年份列出的出版物

zbMATH Open中包含的引文

17出版物被引用108中的次75文件 引用人 年份
一些基于最小二乘的时间差分方法的收敛结果。 Zbl 1367.93731号
于慧珍;Bertsekas,Dimitri P。
14
2009
折扣动态规划中的Q学习和增强策略迭代。 Zbl 1243.90231号
Bertsekas,Dimitri P。;于慧珍
12
2012
用于凸优化的统一多面体近似框架。 Zbl 1218.90154号
Bertsekas,Dimitri P。;于慧珍
10
2011
大型线性系统近似解的投影方程方法。 兹比尔1165.65010
Bertsekas,Dimitri P。;于慧珍
9
2009
步长恒定且缓慢减小的约束强调时间差分学习的弱收敛性。 Zbl 1404.68124号
于慧珍
8
2016
投影线性方程近似值的误差界。 Zbl 1218.90211号
于慧珍;Bertsekas,Dimitri P。
7
2010
最小二乘时间差分法:一般条件下的分析。 Zbl 1274.90478号
于慧珍
7
2012
关于平均成本POMDP有限状态控制器集的近似最优性。 Zbl 1159.93364号
于慧珍;Bertsekas,Dimitri P。
6
2008
具有普遍可测策略的随机控制的混合值和策略迭代方法。 Zbl 1329.90157号
于慧珍;Bertsekas,Dimitri P。
5
2015
随机最短路径问题的Q学习和策略迭代算法。 Zbl 1306.90171号
于慧珍;Bertsekas,Dimitri P。
5
2013
一类总费用Markov决策过程值迭代的收敛性。 Zbl 1327.90364号
于慧珍
5
2015
(2+1)维Korteweg-de-Vries-Sawada-Kotera-Ramani方程中的孤子分子、多呼吸子和混合溶液。 Zbl 1505.35085号
魏鹏飞;龙,春霞;朱,陈;周一婷;于惠珍;任波
5
2022
关于具有可数离散动作空间和严格无界代价的平均代价Markov决策过程的最小对方法。 Zbl 1432.90160号
于慧珍
5
2020
关于广义Bellman方程和时间差分学习。 Zbl 1465.90117号
于慧珍;A.Rupam Mahmood;理查德·萨顿。
2018
随机最短路径问题Q学习迭代的有界性。 Zbl 1291.90296号
于慧珍;Bertsekas,Dimitri P。
2013
具有Borel空间和普遍可测策略的Markov决策过程的平均成本最优不等式。 Zbl 1452.90317号
于慧珍
2020
关于具有可数动作空间和严格无界费用的约束和无约束平均费用Markov决策过程的线性规划。 Zbl 1489.90211号
于慧珍
1
2022
(2+1)维Korteweg-de-Vries-Sawada-Kotera-Ramani方程中的孤子分子、多呼吸子和混合溶液。 兹比尔1505.35085
魏鹏飞;龙,春晓;朱、陈;周毅婷;于惠珍;任波
5
2022
关于具有可数动作空间和严格无界费用的约束和无约束平均费用Markov决策过程的线性规划。 Zbl 1489.90211号
于慧珍
1
2022
关于具有可数离散动作空间和严格无界代价的平均代价Markov决策过程的最小对方法。 Zbl 1432.90160号
于慧珍
5
2020
具有Borel空间和普遍可测策略的Markov决策过程的平均成本最优不等式。 Zbl 1452.90317号
于慧珍
2020
关于广义Bellman方程和时间差分学习。 Zbl 1465.90117号
于慧珍;A.Rupam Mahmood;理查德·萨顿。
2018
步长恒定且缓慢减小的约束强调时间差分学习的弱收敛性。 Zbl 1404.68124号
于慧珍
8
2016
具有普遍可测策略的随机控制的混合值和策略迭代方法。 Zbl 1329.90157号
于慧珍;Bertsekas,Dimitri P。
5
2015
一类总费用Markov决策过程值迭代的收敛性。 Zbl 1327.90364号
于慧珍
5
2015
随机最短路径问题的Q学习和策略迭代算法。 Zbl 1306.90171号
于慧珍;Bertsekas,Dimitri P。
5
2013
随机最短路径问题Q学习迭代的有界性。 Zbl 1291.90296号
于慧珍;Bertsekas,Dimitri P。
2013
折扣动态规划中的Q学习和增强策略迭代。 Zbl 1243.90231号
Bertsekas,Dimitri P。;于慧珍
12
2012
最小二乘时间差分法:一般条件下的分析。 Zbl 1274.90478号
于慧珍
7
2012
凸优化的统一多面体近似框架。 Zbl 1218.90154号
Bertsekas,Dimitri P。;于慧珍
10
2011
投影线性方程近似值的误差界。 Zbl 1218.90211号
于慧珍;Bertsekas,Dimitri P。
7
2010
一些基于最小二乘的时间差分方法的收敛结果。 Zbl 1367.93731号
于慧珍;Bertsekas,Dimitri P。
14
2009
大型线性系统近似解的投影方程方法。 Zbl 1165.65010号
Bertsekas,Dimitri P。;于慧珍
9
2009
关于平均成本POMDP的有限状态控制器集的近似最优性。 Zbl 1159.93364号
于慧珍;Bertsekas,Dimitri P。
6
2008
全部的 前5名

151位作者引用

9 于慧珍
7 迪米特里·潘特利·贝尔塞卡斯
4 Vivek Shripad Borkar
阿里·福鲁塔尼
林,季
马西莫·蒂帕尔迪
2 亚里士多德·阿拉珀塔提斯
2 马克·贝科
2 恩里科·贝蒂奥
2 沙拉布·巴特纳加
2 西德哈特·昌达克
2 尤金·阿列克桑德罗维奇·范伯格
2 阿比舍克·克勒·古普塔。
2 拉斐尔·埃尔沃利诺
2 拉胡尔·贾恩
2 迪利普·卡拉提尔
2 帕夫洛·卡西亚诺夫。
2 阿西克·鲁帕姆·马哈茂德
2 任波
2 弗朗西斯科·里纳尔迪
2 米洛什·斯坦科维奇。
2 Stanković,Srdjan S。
2 理查德·萨顿。
2 塞尔达尔·尤克塞尔
1 爱迪生·F·阿鲁达。
1 塔尔阿维纳达夫
1 彼得·L·巴特利特。
1 卡罗琳·贝克。
1 塔尔·本·兹维
1 贾拉吉·班达里
1 克里斯托夫·布赫海姆
1 阿纳·布西奇
1 蔡跃进
1 佩林·G·坎博拉特。
1 曹嘉庆
1 陈浩
1 陈思璐
1 郑康
1 塔季亚纳·切尔诺格
1 穆拉特·库布克特佩
1 德科,Ton G。
1 玛丽安娜·德·桑提斯
1 Nico P.Dellaert。
1 阿迪蒂亚·德夫拉吉。
1 苏巴拉坎蒂·戴伊
1 弗兰克·杰姆
1 乔安·巴尔(Joáo B.R.do Val)。
1 Doan,Thinh T。
1 多迪亚,帕斯
1 多尔黑尔,哈什
1 丹尼尔·德弗勒
1 弗朗索瓦·杜福尔
1 阿明·埃夫特哈里
1 克里斯蒂安·埃利斯
1 费金熙
1 费淑敏
1 马塞洛·杜特拉·弗拉戈索
1 傅启明
1 福岛,第一
1 阿拉什·吉夫奇
1 路易吉·格列尔莫
1 戈兰,迈克尔
1 威廉·本杰明·哈斯克尔
1 拉斐尔·安德烈亚斯·豪泽
1 何凌超
1 埃尔南德斯·勒尔马(Onésimo Hernández-Lerma)
1 约翰内斯·霍纳
1 尼曼尼亚·伊利奇
1 约瑟夫·阿金·乔治
1 内森·卡卢斯
1 迪米特里斯·卡米利斯
1 阿里·德夫兰·卡拉
1 普拉森吉特·卡马卡
1 艾达·卡贾维拉德
1 乔治·科尼达利斯。
1 纳撒尼尔·科尔达
1 Laura-Guarachi,Leonardo R。
1 克雷格·列侬
1 卢卡斯·莱托卡特
1 刘军
1 刘,权
1 刘晓梅
1 戴维·刘扎
1 安德烈亚斯·洛赫
1 Luan、Nguyen Ngoc
1 罗伯特·朗
1 马庆英
1 马正毅
1 Siva Theja Maguluri
1 海因里希·马辛格三世
1 索尔·门多扎·帕拉西奥斯
1 肖恩·梅恩(Sean P.Meyn)。
1 索马里莫阿泽尼
1 牟文龙
1 雷米·穆诺斯
1 马齐亚·帕尔杭
1 阿什温·帕南贾迪
1 皮建宗
1 尼克·波利多里德斯
1 沃伦·巴克勒·鲍威尔
…还有51位作者

按年份列出的引文