段靖良
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [公元19年] 段靖良 , Yangang Ren公司 , 张发旺(Fawang Zhang) , 李杰(音译) , 升波·伊本·李 , 杨冠 , 李克强 :
编码分布式软行动者——多车道场景下自动驾驶的关键技术[研究前沿][研究前沿]。 IEEE计算。 智力。 美格。 19 ( 2 ) : 96-112 ( 2024 ) [公元18年] 李杰(音译) , 升波·伊本·李 , 段靖良 , 姚璐 , 邹文军 , 杨冠 , 尹玉铭(Yuming Yin) :
非线性零和对策的松弛策略迭代算法及其在H∞控制中的应用。 IEEE传输。 自动。 控制。 69 ( 1 ) : 426-433 ( 2024 ) [公元17年] 段靖良 , 曹文翰 , 杨正 , 林昭(Lin Zhao) :
动态输出反馈线性二次控制的优化问题。 IEEE传输。 自动。 控制。 69 ( 2 ) : 920-935 ( 2024 ) [公元16年] 余东杰 , 邹文军 , 杨玉洁 , 海通马 , 升波·伊本·李 , 尹玉铭(Yuming Yin) , 陈建宇 , 段靖良 :
基于安全模型的强化学习,具有不确定感知可达性证书。 IEEE自动变速器。 科学。 工程师。 21 ( 三 ) : 4129-4142 ( 2024 ) [公元15年] 段靖良 , 李杰(音译) , 陈旭阳 , 赵凯(Kai Zhao) , 升波·伊本·李 , 林昭(Lin Zhao) :
离散时间静态输出反馈策略梯度方法的优化前景。 IEEE传输。 赛博。 54 ( 6 ) : 3588-3601 ( 2024 ) [公元14年] 粤曲 , 朱红青 , 高树华 , Jun Guan先生 , 郝其燕 , 李明肖 , 升波·伊本·李 , 段靖良 :
RL-Driven MPPI:利用离线策略加速在线控制律计算。 IEEE传输。 智力。 车辆。 9 ( 2 ) : 3605-3616 ( 2024 ) [j13] 白玉鹏 , 段靖良 , 陈建宇 , 升波·伊本·李 , 谢根进(Genjin Xie) , 张聪生 , 杨冠 , 姚牧 , 孙恩欣 :
基于模型的机会约束的分离比例积分拉格朗日强化学习。 IEEE传输。 神经网络学习。 系统。 35 ( 1 ) : 466-478 ( 2024 ) [第11条] 秦沈涛 , 杨玉洁 , 姚牧 , 李杰(音译) , 邹文军 , 段靖良 , 升波·伊本·李 :
可行可达策略迭代。 ICML公司 2024 [i34] 邹文军 , 姚璐 , 李杰(音译) , 杨玉洁 , 升波·伊本·李 , 段靖良 , Xianyuan Zhan先生 , 刘晶晶女士 , 张亚琴 , 李克强 :
安全强化学习中的政策分歧。 CoRR公司 腹肌/2403.12847 ( 2024 ) [i33] 王一诺 , 王利坤 , 蒋宇轩 , 邹文军 , 刘彤(音译) , 宋旭杰 , 王文轩 , 李明肖 , 姜武 , 段靖良 , 升波·伊本·李 :
带熵调节器的扩散系数临界。 CoRR公司 abs/2405.15177 ( 2024 ) 2023 [公元12年] 杨冠 , Yangang Ren公司 , 戚孙 , 升波·伊本·李 , 海通马 , 段靖良 , 戴一凡 , 薄成 :
综合决策和控制:实现可解释和计算效率的驾驶智能。 IEEE传输。 赛博。 53 ( 2 ) : 859-873 ( 2023 ) [公元11年] 林子玉 , 马骏(Jun Ma) , 段靖良 , 升波·伊本·李 , 海通马 , 薄成 , 李东恒 :
约束动态环境下基于策略迭代的自主驾驶近似动态规划。 IEEE传输。 智力。 运输。 系统。 24 ( 5 ) : 5003-5013 ( 2023 ) [公元10年] 段靖良 , 李杰(音译) , 葛强 , 升波·伊本·李 , 莫尼莫·布贾巴鲁 , 费马 , 张德钊 :
非线性系统连续时间最优控制的具有收敛保证的松弛Actor-Critic。 IEEE传输。 智力。 车辆。 8 ( 5 ) : 3299-3311 ( 2023 ) [公元9年] 林子玉 , 段靖良 , 升波·伊本·李 , 海通马 , 李杰(音译) , 陈建宇 , 薄成 , 马骏(Jun Ma) :
连续时间非线性最优控制的基于策略迭代的有限水平近似动态规划。 IEEE传输。 神经网络学习。 系统。 34 ( 9 ) : 5255-5267 ( 2023 ) [第10条] 陈旭阳 , 段靖良 , 梁应斌 , 林昭(Lin Zhao) :
求解线性二次调节器的两时间尺度Actor-Critic的全局收敛性。 AAAI公司 2023 : 7087-7095 【c9】 郭建战 , 蒋宇轩 , 段靖良 , 升波·伊本·李 , 薄成 , 李克强 :
连续时间策略优化。 自动控制 2023 : 3382-3388 【c8】 宋旭杰 , 段靖良 , 王文轩 , 升波·伊本·李 , 陈晨 , 薄成 , 张波(音译) , 魏俊清 , 小明Simon Wang :
LipsNet:具有自适应Lipschitz常数的平滑鲁棒神经网络,用于高精度最优控制。 ICML公司 2023 : 32253-32272 [i32] 段靖良 , 王文轩 , 李明肖 , 嘉信高 , 升波·伊本·李 :
DSAC-T:具有三种改进的分配软参与者-关键。 CoRR公司 腹肌/2310.05858 ( 2023 ) [i31] 段靖良 , 李杰(音译) , 陈旭阳 , 赵凯(Kai Zhao) , 升波·伊本·李 , 林昭(Lin Zhao) :
离散时间静态输出反馈策略梯度方法的优化前景。 CoRR公司 abs/2310.19022 ( 2023 ) [i30] 宋旭杰 , 刘彤(音译) , 升波·伊本·李 , 段靖良 , 王文轩 , 李克强 :
在Ising机器上训练多层神经网络。 CoRR公司 abs/2311.03408 ( 2023 ) [i29] 郝其燕 , 徐浩源 , 高洪波 , 费马 , 升波·伊本·李 , 段靖良 :
通过强化学习实现钻臂寻孔综合控制。 CoRR公司 abs/2312.01836 ( 2023 ) 2022 [j8] 段靖良 , 刘征宇(音) , 升波·伊本·李 , 戚孙 , 贾振中 , 薄成 :
状态约束非仿射非线性最优控制问题的自适应动态规划。 神经计算 484 : 128-141 ( 2022 ) [j7] 刘征宇(音) , 段靖良 , 王文轩 , 升波·伊本·李 , 尹玉铭(Yuming Yin) , 林子玉 , 薄成 :
递归模型预测控制:学习非线性系统的显式递归控制器。 IEEE传输。 Ind.Electron公司。 69 ( 10 ) : 10437-10446 ( 2022 ) [j6] 段靖良 , 余东杰 , 升波·伊本·李 , 王文轩 , Yangang Ren公司 , 林子玉 , 薄成 :
自动驾驶的固定维和置换不变状态表示。 IEEE传输。 智力。 运输。 系统。 23 ( 7 ) : 9518-9528 ( 2022 ) [j5] Yangang Ren公司 , 姜建华 , 郭建战 , 升波·伊本·李 , 陈晨 , 李克强 , 段靖良 :
信号交叉口自动车辆综合决策和控制的自学习智能。 IEEE传输。 智力。 运输。 系统。 23 ( 12 ) : 24145-24156 ( 2022 ) [j4] 段靖良 , 杨冠 , 升波·伊本·李 , Yangang Ren公司 , 戚孙 , 薄成 :
分配软参与者关键:解决价值估计错误的非政策强化学习。 IEEE传输。 神经网络学习。 系统。 33 ( 11 ) : 6584-6598 ( 2022 ) 【c7】 段靖良 , 李杰(音译) , 升波·伊本·李 , 林昭(Lin Zhao) :
离散时间静态输出反馈梯度下降的优化前景。 自动控制 2022 : 2932-2937 【c6】 段靖良 , 曹文翰 , 杨正 , 林昭(Lin Zhao) :
动态输出反馈的优化前景:线性二次调节器的案例研究。 疾病预防控制中心 2022 : 4040-4045 【c5】 曹文翰 , 段靖良 , 升波·伊本·李 , 陈晨 , 刘畅(Chang Liu) , Yu Wang(王宇) :
具有可行性和近优保证的原对偶估计学习方法。 疾病预防控制中心 2022 : 4104-4111 [第28条] 段靖良 , 曹文翰 , 杨正 , 林昭(Lin Zhao) :
动态输出反馈线性二次控制的优化问题。 CoRR公司 abs/2201.09598 ( 2022 ) [i27] 曹文翰 , 段靖良 , 升波·伊本·李 , 陈晨 , 刘畅(Chang Liu) , Yu Wang(王宇) :
原对偶估计学习:一种具有可行性和近优保证的离线约束移动地平线估计方法。 CoRR公司 abs/2204.02857 ( 2022 ) [i26] Yangang Ren公司 , 郭建战 , 李业堂 , 升波·伊本·李 , 姜建华 , 段靖良 :
利用对抗性学习提高信号交叉口驾驶政策的通用性。 CoRR公司 abs/2204.04403 ( 2022 ) [i25] 陈旭阳 , 段靖良 , 梁应斌 , 林昭(Lin Zhao) :
求解线性二次调节器的两时间尺度Actor-Critic的全局收敛性。 CoRR公司 腹肌/2208.08744 ( 2022 ) 【i24】 段靖良 , 曹文翰 , 杨正 , 林昭(Lin Zhao) :
动态输出反馈的优化前景:线性二次调节器的案例研究。 CoRR公司 abs/2209.05042 ( 2022 ) [第23条] 余东杰 , 邹文军 , 杨玉洁 , 海通马 , 升波·伊本·李 , 段靖良 , 陈建宇 :
基于安全模型的强化学习,具有不确定感知可达性证书。 CoRR公司 abs/2210.07553 ( 2022 ) [i22] Yangang Ren公司 , 姚璐 , 王文轩 , 升波·伊本·李 , 李泽阳 , 段靖良 :
零和马尔可夫对策的平滑策略迭代。 CoRR公司 abs/2212.01623 ( 2022 ) 2021 [j3] 杨冠 , 升波·伊本·李 , 段靖良 , 李杰(音译) , Yangang Ren公司 , 戚孙 , 薄成 :
直接和间接强化学习。 《国际情报杂志》。 系统。 36 ( 8 ) : 4439-4467 ( 2021 ) [注2] 杨冠 , 升波·伊本·李 , 段靖良 , 李杰(音译) , Yangang Ren公司 , 戚孙 , 薄成 :
封面:《国际智能系统杂志》,第36卷,2021年8月8日第8期。 《国际情报杂志》。 系统。 36 ( 8 ) : 我 ( 2021 ) 【c4】 谷子青 , 杨玉洁 , 段靖良 , 升波·伊本·李 , 陈建宇 , 曹文翰 , 郑思发 :
不确定条件下自主车辆决策的信念状态分离强化学习。 ITSC公司 2021 : 586-592 【c3】 白玉鹏 , 姚牧 , 段靖良 , 杨冠 , 升波·伊本·李 , 陈建宇 :
机会约束强化学习的分离比例积分拉格朗日方法。 四、 2021 : 193-199 【i21】 白玉鹏 , 姚牧 , 段靖良 , 杨冠 , 升波·伊本·李 , 陈建宇 :
机会约束强化学习的分离比例积分拉格朗日方法。 CoRR公司 abs/2102.08539 ( 2021 ) [i20] 刘征宇(音) , 段靖良 , 王文轩 , 升波·伊本·李 , 尹玉铭(Yuming Yin) , 林子玉 , 戚孙 , 薄成 :
递归模型预测控制。 CoRR公司 abs/2102.10289 ( 2021 ) [i19] 杨冠 , 段靖良 , 升波·伊本·李 , 李杰(音译) , 陈建宇 , 薄成 :
混合政策梯度。 CoRR公司 abs/2102.11513 ( 2021 ) [i18] 刘征宇(音) , 段靖良 , 王文轩 , 升波·伊本·李 , 尹玉铭(Yuming Yin) , 林子玉 , 戚孙 , 薄成 :
递归模型预测控制。 CoRR公司 abs/2102.11736 ( 2021 ) [i17] Yiting Kong公司 , 杨冠 , 段靖良 , 升波·伊本·李 , 戚孙 , 聂冰冰 :
基于分布式软参与者批判性算法的放大器合并场景下的决策。 CoRR公司 abs/2103.04535 ( 2021 ) [i16] 唐开明 , 升波·伊本·李 , 尹玉铭(Yuming Yin) , 杨冠 , 段靖良 , 曹文翰 , 李杰(音译) :
线性高斯时变系统的近似最优滤波器。 CoRR公司 abs/2103.05505 ( 2021 ) 【i15】 杨冠 , Yangang Ren公司 , 升波·伊本·李 , 海通马 , 段靖良 , 薄成 :
综合决策和控制:实现可解释的高效驾驶智能。 CoRR公司 abs/2103.10290 ( 2021 ) [第14条] 段靖良 , 余东杰 , 升波·伊本·李 , 王文轩 , Yangang Ren公司 , 林子玉 , 薄成 :
自动驾驶的固定维和置换不变状态表示。 CoRR公司 abs/2105.11299 ( 2021 ) [i13] 白玉鹏 , 段靖良 , 陈建宇 , 升波·伊本·李 , 谢根进(Genjin Xie) , 张聪生 , 杨冠 , 姚牧 , 孙恩欣 :
基于模型的基于分离比例积分拉格朗日的机会约束强化学习。 CoRR公司 abs/2108.11623 ( 2021 ) [i12] 段靖良 , Yangang Ren公司 , 张发旺(Fawang Zhang) , 杨冠 , 余东杰 , 升波·伊本·李 , 薄成 , 林昭(Lin Zhao) :
编码分布式软角色——对多车道场景中的自动驾驶至关重要。 CoRR公司 abs/2109.05540 ( 2021 ) [i11] 段靖良 , 李杰(音译) , 林昭(Lin Zhao) :
离散时间静态输出反馈梯度下降的优化前景。 CoRR公司 abs/2109.13132 ( 2021 ) [i10] Yangang Ren公司 , 姜建华 , 段靖良 , 升波·伊本·李 , 余东杰 , 郭建战 :
混合交通流下自动驾驶的编码集成决策与控制。 CoRR公司 abs/2110.12359 ( 2021 ) 2020 [c2] Yangang Ren公司 , 段靖良 , 升波·伊本·李 , 杨冠 , 戚孙 :
用Minimax分布软行动者改进强化学习的泛化。 ITSC公司 2020 : 1-6 【c1】 卢文 , 段靖良 , 升波·伊本·李 , 徐绍兵 , 惠鹏 :
基于并行约束策略优化的自主车辆安全强化学习 * . ITSC公司 2020 : 1-7 [第九章] 段靖良 , 杨冠 , Yangang Ren公司 , 升波·伊本·李 , 薄成 :
用状态-动作返回分布函数解决强化学习中的值估计错误。 CoRR公司 abs/2001.02811 ( 2020 ) [i8] 段靖良 , 升波·伊本·李 , 杨冠 , 戚孙 , 薄成 :
无需依赖标记驾驶数据的自我驾驶决策的分层强化学习。 CoRR公司 abs/2001.09816 ( 2020 ) [i7] Yangang Ren公司 , 段靖良 , 杨冠 , 升波·伊本·李 :
用Minimax分布软行动者改进强化学习的泛化。 CoRR公司 abs/2002.05502 ( 2020 ) [i6] 卢文 , 段靖良 , 升波·伊本·李 , 徐绍兵 , 惠鹏 :
基于并行约束策略优化的自主车辆安全强化学习。 CoRR公司 abs/2003.01303 ( 2020 ) [i5] 林子玉 , 段靖良 , 升波·伊本·李 , 海通马 , 尹玉铭(Yuming Yin) :
用于高效自动车辆控制器设计的连续时间有限时域ADP。 CoRR公司 abs/2007.02070 ( 2020 ) [i4] 李杰(音译) , 升波·伊本·李 , 杨冠 , 段靖良 , 李文宇 , 尹玉铭(Yuming Yin) :
非线性鲁棒控制的三元策略迭代算法。 CoRR公司 abs/2007.06810 ( 2020 )
2010 – 2019
2019 [i3] 段靖良 , 升波·伊本·李 , 刘征宇(音) , 莫尼莫·布贾巴鲁 , 薄成 :
连续时间最优控制的广义策略迭代。 CoRR公司 abs/1909.05402 ( 2019 ) [i2] 段靖良 , 刘征宇(音) , 升波·伊本·李 , 戚孙 , 贾振中 , 薄成 :
状态约束非仿射非线性最优控制问题的深度自适应动态规划。 CoRR公司 abs/1911.11397 ( 2019 ) [i1] 杨冠 , 升波·伊本·李 , 段靖良 , 李杰(音译) , Yangang Ren公司 , 薄成 :
直接和间接强化学习。 CoRR公司 abs/1912.10600 ( 2019 ) 2017 [j1] 升波·伊本·李 , 郭强强 , 徐绍兵 , 段靖良 , 沈丽(Shen Li) , 李成军 , 苏奎凤 :
考虑道路高程信息的自适应巡航控制系统性能增强预测控制。 IEEE传输。 智力。 车辆。 2 ( 三 ) : 150-160 ( 2017 )