编辑配置文件(在新选项卡中打开) 于慧珍 合著者距离 作者ID: 于慧珍 发布日期: 于慧珍;于惠珍 已编制索引的文档: 26出版物自1991年以来,包括4个附加arXiv预打印 合著者: 12位合著者具有15份联合出版物 308合著作者 全部的 前5名合著者 11 单作者的 9 迪米特里·潘特利·贝尔塞卡斯 2 阿西克·鲁帕姆·马哈茂德 2 理查德·萨顿。 1 W.Eric L.Grimson。 1 赖绍勇 1 龙,春霞 1 马绍翰 1 任波 1 王爱音 1 魏鹏飞 1 周一婷 1 朱,陈 全部的 前5名系列 6 运筹学数学 4 SIAM控制与优化杂志 2 机器学习研究杂志(JMLR) 1 数学分析与应用杂志 1 混沌、孤子和分形 1 IEEE自动控制汇刊 1 计算与应用数学杂志 1 山东大学学报。自然科学版 1 运筹学年鉴 1 SIAM优化期刊 1 MathematicaÆterna(数学术语) 全部的 前5名领域 19 运筹学、数学规划(90-XX) 12 系统理论;控制(93至XX) 7 计算机科学(68至XX) 三 概率论与随机过程(60-XX) 三 统计学(62-XX) 三 数值分析(65-XX) 2 偏微分方程(35-XX) 1 近似值和展开值(41-XX) 1 变分法与最优控制;最优化(49至XX) 按年份列出的出版物 所有引用出版物 前5名被引用出版物 zbMATH Open中包含的引文 17出版物被引用108中的次75文件 引用人▼ 年份▼ 一些基于最小二乘的时间差分方法的收敛结果。 Zbl 1367.93731号 于慧珍;Bertsekas,Dimitri P。 14 2009 折扣动态规划中的Q学习和增强策略迭代。 Zbl 1243.90231号 Bertsekas,Dimitri P。;于慧珍 12 2012 用于凸优化的统一多面体近似框架。 Zbl 1218.90154号 Bertsekas,Dimitri P。;于慧珍 10 2011 大型线性系统近似解的投影方程方法。 兹比尔1165.65010 Bertsekas,Dimitri P。;于慧珍 9 2009 步长恒定且缓慢减小的约束强调时间差分学习的弱收敛性。 Zbl 1404.68124号 于慧珍 8 2016 投影线性方程近似值的误差界。 Zbl 1218.90211号 于慧珍;Bertsekas,Dimitri P。 7 2010 最小二乘时间差分法:一般条件下的分析。 Zbl 1274.90478号 于慧珍 7 2012 关于平均成本POMDP有限状态控制器集的近似最优性。 Zbl 1159.93364号 于慧珍;Bertsekas,Dimitri P。 6 2008 具有普遍可测策略的随机控制的混合值和策略迭代方法。 Zbl 1329.90157号 于慧珍;Bertsekas,Dimitri P。 5 2015 随机最短路径问题的Q学习和策略迭代算法。 Zbl 1306.90171号 于慧珍;Bertsekas,Dimitri P。 5 2013 一类总费用Markov决策过程值迭代的收敛性。 Zbl 1327.90364号 于慧珍 5 2015 (2+1)维Korteweg-de-Vries-Sawada-Kotera-Ramani方程中的孤子分子、多呼吸子和混合溶液。 Zbl 1505.35085号 魏鹏飞;龙,春霞;朱,陈;周一婷;于惠珍;任波 5 2022 关于具有可数离散动作空间和严格无界代价的平均代价Markov决策过程的最小对方法。 Zbl 1432.90160号 于慧珍 5 2020 关于广义Bellman方程和时间差分学习。 Zbl 1465.90117号 于慧珍;A.Rupam Mahmood;理查德·萨顿。 三 2018 随机最短路径问题Q学习迭代的有界性。 Zbl 1291.90296号 于慧珍;Bertsekas,Dimitri P。 三 2013 具有Borel空间和普遍可测策略的Markov决策过程的平均成本最优不等式。 Zbl 1452.90317号 于慧珍 三 2020 关于具有可数动作空间和严格无界费用的约束和无约束平均费用Markov决策过程的线性规划。 Zbl 1489.90211号 于慧珍 1 2022 (2+1)维Korteweg-de-Vries-Sawada-Kotera-Ramani方程中的孤子分子、多呼吸子和混合溶液。 兹比尔1505.35085 魏鹏飞;龙,春晓;朱、陈;周毅婷;于惠珍;任波 5 2022 关于具有可数动作空间和严格无界费用的约束和无约束平均费用Markov决策过程的线性规划。 Zbl 1489.90211号 于慧珍 1 2022 关于具有可数离散动作空间和严格无界代价的平均代价Markov决策过程的最小对方法。 Zbl 1432.90160号 于慧珍 5 2020 具有Borel空间和普遍可测策略的Markov决策过程的平均成本最优不等式。 Zbl 1452.90317号 于慧珍 三 2020 关于广义Bellman方程和时间差分学习。 Zbl 1465.90117号 于慧珍;A.Rupam Mahmood;理查德·萨顿。 三 2018 步长恒定且缓慢减小的约束强调时间差分学习的弱收敛性。 Zbl 1404.68124号 于慧珍 8 2016 具有普遍可测策略的随机控制的混合值和策略迭代方法。 Zbl 1329.90157号 于慧珍;Bertsekas,Dimitri P。 5 2015 一类总费用Markov决策过程值迭代的收敛性。 Zbl 1327.90364号 于慧珍 5 2015 随机最短路径问题的Q学习和策略迭代算法。 Zbl 1306.90171号 于慧珍;Bertsekas,Dimitri P。 5 2013 随机最短路径问题Q学习迭代的有界性。 Zbl 1291.90296号 于慧珍;Bertsekas,Dimitri P。 三 2013 折扣动态规划中的Q学习和增强策略迭代。 Zbl 1243.90231号 Bertsekas,Dimitri P。;于慧珍 12 2012 最小二乘时间差分法:一般条件下的分析。 Zbl 1274.90478号 于慧珍 7 2012 凸优化的统一多面体近似框架。 Zbl 1218.90154号 Bertsekas,Dimitri P。;于慧珍 10 2011 投影线性方程近似值的误差界。 Zbl 1218.90211号 于慧珍;Bertsekas,Dimitri P。 7 2010 一些基于最小二乘的时间差分方法的收敛结果。 Zbl 1367.93731号 于慧珍;Bertsekas,Dimitri P。 14 2009 大型线性系统近似解的投影方程方法。 Zbl 1165.65010号 Bertsekas,Dimitri P。;于慧珍 9 2009 关于平均成本POMDP的有限状态控制器集的近似最优性。 Zbl 1159.93364号 于慧珍;Bertsekas,Dimitri P。 6 2008 所有引用出版物 前5名被引用出版物 全部的 前5名151位作者引用 9 于慧珍 7 迪米特里·潘特利·贝尔塞卡斯 4 Vivek Shripad Borkar 三 阿里·福鲁塔尼 三 林,季 三 马西莫·蒂帕尔迪 2 亚里士多德·阿拉珀塔提斯 2 马克·贝科 2 恩里科·贝蒂奥 2 沙拉布·巴特纳加 2 西德哈特·昌达克 2 尤金·阿列克桑德罗维奇·范伯格 2 阿比舍克·克勒·古普塔。 2 拉斐尔·埃尔沃利诺 2 拉胡尔·贾恩 2 迪利普·卡拉提尔 2 帕夫洛·卡西亚诺夫。 2 阿西克·鲁帕姆·马哈茂德 2 任波 2 弗朗西斯科·里纳尔迪 2 米洛什·斯坦科维奇。 2 Stanković,Srdjan S。 2 理查德·萨顿。 2 塞尔达尔·尤克塞尔 1 爱迪生·F·阿鲁达。 1 塔尔阿维纳达夫 1 彼得·L·巴特利特。 1 卡罗琳·贝克。 1 塔尔·本·兹维 1 贾拉吉·班达里 1 克里斯托夫·布赫海姆 1 阿纳·布西奇 1 蔡跃进 1 佩林·G·坎博拉特。 1 曹嘉庆 1 陈浩 1 陈思璐 1 郑康 1 塔季亚纳·切尔诺格 1 穆拉特·库布克特佩 1 德科,Ton G。 1 玛丽安娜·德·桑提斯 1 Nico P.Dellaert。 1 阿迪蒂亚·德夫拉吉。 1 苏巴拉坎蒂·戴伊 1 弗兰克·杰姆 1 乔安·巴尔(Joáo B.R.do Val)。 1 Doan,Thinh T。 1 多迪亚,帕斯 1 多尔黑尔,哈什 1 丹尼尔·德弗勒 1 弗朗索瓦·杜福尔 1 阿明·埃夫特哈里 1 克里斯蒂安·埃利斯 1 费金熙 1 费淑敏 1 马塞洛·杜特拉·弗拉戈索 1 傅启明 1 福岛,第一 1 阿拉什·吉夫奇 1 路易吉·格列尔莫 1 戈兰,迈克尔 1 威廉·本杰明·哈斯克尔 1 拉斐尔·安德烈亚斯·豪泽 1 何凌超 1 埃尔南德斯·勒尔马(Onésimo Hernández-Lerma) 1 约翰内斯·霍纳 1 尼曼尼亚·伊利奇 1 约瑟夫·阿金·乔治 1 内森·卡卢斯 1 迪米特里斯·卡米利斯 1 阿里·德夫兰·卡拉 1 普拉森吉特·卡马卡 1 艾达·卡贾维拉德 1 乔治·科尼达利斯。 1 纳撒尼尔·科尔达 1 Laura-Guarachi,Leonardo R。 1 克雷格·列侬 1 卢卡斯·莱托卡特 1 刘军 1 刘,权 1 刘晓梅 1 戴维·刘扎 1 安德烈亚斯·洛赫 1 Luan、Nguyen Ngoc 1 罗伯特·朗 1 马庆英 1 马正毅 1 Siva Theja Maguluri 1 海因里希·马辛格三世 1 索尔·门多扎·帕拉西奥斯 1 肖恩·梅恩(Sean P.Meyn)。 1 索马里莫阿泽尼 1 牟文龙 1 雷米·穆诺斯 1 马齐亚·帕尔杭 1 阿什温·帕南贾迪 1 皮建宗 1 尼克·波利多里德斯 1 沃伦·巴克勒·鲍威尔 …还有51位作者 全部的 前5名42篇连载文章中引用 5 SIAM控制与优化杂志 4 Automatica公司 三 数学分析与应用杂志 三 运筹学数学 三 运筹学 三 系统和控制信件 三 机器学习 三 欧洲运筹学杂志 三 随机系统 三 SIAM数据科学数学杂志 2 国际控制杂志 2 最优化理论与应用杂志 2 运筹学年鉴 2 SIAM优化期刊 2 计算优化与应用 2 机器学习研究杂志(JMLR) 2 理论物理交流 1 人工智能 1 应用力学与工程中的计算机方法 1 波浪运动 1 混沌、孤子和分形 1 计量经济学 1 信息科学 1 美国统计协会杂志 1 海军研究后勤 1 运营研究信件 1 优化 1 计算机与运筹学 1 经济动力学与控制杂志 1 应用数学快报 1 全球优化杂志 1 伯努利 1 欧洲控制杂志 1 软计算 1 国际应用数学与计算机科学杂志 1 控制理论与应用杂志 1 随机性 1 优化信函 1 数学规划计算 1 动态游戏和应用 1 数理统计与学习 1 信息系统与运筹学 全部的 前5名在15个字段中引用 48 运筹学、数学规划(90-XX) 22 系统理论;控制(93至XX) 18 计算机科学(68至XX) 8 概率论与随机过程(60-XX) 7 统计学(62-XX) 6 变分法与最优控制;最优化(49至XX) 5 偏微分方程(35-XX) 5 数值分析(65-XX) 5 博弈论、经济学、金融和其他社会和行为科学(91-XX) 4 动力系统和遍历理论(37至XX) 2 凸和离散几何(52至XX) 1 组合数学(05-XX) 1 线性代数和多线性代数;矩阵理论(15-XX) 1 测量和集成(28-XX) 1 粒子和系统力学(70-XX) 按年份列出的引文