Thinh T.Doan公司 0001
人员信息
附属: 弗吉尼亚理工大学,布拉德利电气与计算机工程系,弗吉尼亚州阿灵顿,美国
其他同名人员
SPARQL查询
优化列表
2020年–今天
2024 [公元18年] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
一个双时间尺度随机优化框架及其在控制和强化学习中的应用。 SIAM J.Optim公司。 34 ( 1 ) : 946-976 ( 2024 ) [公元28年] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 :
快速双时间尺度随机梯度方法及其在强化学习中的应用。 COLT公司 2024 : 5166-5212 [公元27年] Duy Anh Do公司 , Thinh T.Doan公司 :
非凸极小极大优化问题中梯度下降动力学在时滞下的收敛速度。 ECC公司 2024 : 2748-2753 [公元26年] 白一涛 , Thinh T.Doan公司 :
求解多任务强化学习的增量策略梯度方法的有限时间复杂性。 L4DC(L4DC) 2024 : 1046-1057 [i26] Thinh T.Doan公司 :
快速非线性双时间尺度随机逼近:实现O(1/k)有限样本复杂性。 CoRR公司 abs/2401.12764 ( 2024 ) [i25] 曾思涵 , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
约束多任务强化学习的自然策略梯度和行为批评方法。 CoRR公司 abs/2405.02456 ( 2024 ) 【i24】 曾思翰(Sihan Zeng) , Thinh T.Doan公司 :
快速二时间尺度随机梯度法及其在强化学习中的应用。 CoRR公司 abs/2405.09660 ( 2024 ) [第23条] 镇远苑 , Thinh T.Doan公司 :
用于可信不确定性量化的贝叶斯元学习。 CoRR公司 abs/2407.19287 ( 2024 ) 2023 [j17] Thinh T.Doan公司 :
分布局部随机逼近的有限时间收敛速度。 自动。 158 : 111294 ( 2023 ) [公元16年] Thinh T.Doan公司 :
马尔可夫梯度下降的有限时间分析。 IEEE传输。 自动。 控制。 68 ( 4 ) : 2140-2153 ( 2023 ) [公元15年] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
分散随机逼近的有限时间收敛速度及其在多智能体和多任务学习中的应用。 IEEE传输。 自动。 控制。 68 ( 5 ) : 2758-2773 ( 2023 ) [公元14年] 萨贾德·科达迪安 , Thinh T.Doan公司 , 贾斯汀·隆伯格 , 西瓦·塞娅·马古鲁里 :
二时间尺度自然行动者批判算法的有限样本分析。 IEEE传输。 自动。 控制。 68 ( 6 ) : 3273-3284 ( 2023 ) [j13] Thinh T.Doan公司 :
非线性双时间尺度随机逼近:收敛性和有限时间性能。 IEEE传输。 自动。 控制。 68 ( 8 ) : 4695-4705 ( 2023 ) [公元12年] 尼鲁帕姆·古普塔 , Thinh T.Doan公司 , 尼丁·H·瓦迪亚 :
联邦地方SGD在$2f$冗余下的拜占庭容错。 IEEE传输。 控制。 Netw公司。 系统。 10 ( 4 ) : 1669-1681 ( 2023 ) [公元11年] 昊慧畅 , 宋一飞 , Thinh T.Doan公司 , 刘玲佳 :
用于动态频谱访问的联合多代理深度强化学习(Fed-MADRL)。 IEEE传输。 Wirel公司。 Commun公司。 22 ( 8 ) : 5337-5348 ( 2023 ) [公元25年] 阿米特·杜塔 , Thinh T.Doan公司 , 杰弗里·里德 :
具有2-$f$冗余的分布式非凸优化中拜占庭攻击下的弹性联合学习。 疾病预防控制中心 2023 : 1156-1161 [公元24年] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
(深度)强化学习中的连通超水平集及其在极大极小定理中的应用。 NeurIPS公司 2023 [i22] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
(深度)强化学习中的连通超水平集及其在极大极小定理中的应用。 CoRR公司 abs/2303.12981 ( 2023 ) 2022 [公元10年] 陈再伟 , Sheng Zhang先生 , Thinh T.Doan公司 , 约翰·保罗·克拉克 , 西瓦·塞娅·马古鲁里 :
非线性随机逼近的有限样本分析及其在强化学习中的应用。 自动。 146 : 110623 ( 2022 ) 【c23】 萨纳杜蒂梵天 , 白一涛 , Duy Anh Do公司 , Thinh T.Doan公司 :
随机和乐观环境下零和马尔可夫对策异步策略迭代的收敛速度。 疾病预防控制中心 2022 : 3493-3498 [公元22年] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
约束马尔可夫决策过程在线原始-对偶自然行动者临界算法的有限时间复杂性。 疾病预防控制中心 2022 : 4028-4033 [c21] 阿米特·杜塔 , 尼拉·马斯鲁里萨达特 , Thinh T.Doan公司 :
集群网络上分散梯度动力学的收敛速度:多时间尺度Lyapunov方法。 疾病预防控制中心 2022 : 6497-6502 [公元20年] 阿米特·杜塔 , Almuatazbellah M.博克 , Thinh T.Doan公司 :
集群网络上分布式一致性的收敛速度:一种双时间尺度方法。 疾病预防控制中心 2022 : 7035-7040 [第19条] Thinh T.Doan公司 :
求解非凸极小极大问题的二时间尺度梯度下降动力学的收敛速度。 L4DC(L4DC) 2022 : 192-206 [第18条] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
二人零和马尔可夫对策的正则梯度下降上升。 NeurIPS公司 2022 【i21】 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
二人零和马尔可夫对策的正则梯度下降上升。 CoRR公司 abs/2205.13746 ( 2022 ) [i20] 陈定阳 , 张琪(音译) , Thinh T.Doan公司 :
马尔可夫势对策中Softmax策略梯度的收敛性和无政府保证的价格。 CoRR公司 abs/2206.07642 ( 2022 ) 2021 [公元9年] Thinh T.Doan公司 :
线性二时间尺度随机逼近的有限时间分析与重启方案。 SIAM J.控制。 最佳方案。 59 ( 4 ) : 2798-2819 ( 2021 ) [j8] Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 贾斯汀·隆伯格 :
线性函数逼近分布式时差学习的有限时间性能。 SIAM J.数学。 数据科学。 三 ( 1 ) : 298-320 ( 2021 ) [j7] Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 贾斯汀·隆伯格 :
自适应量化分布式子梯度方法的快速收敛速度。 IEEE传输。 自动。 控制。 66 ( 5 ) : 2191-2205 ( 2021 ) [j6] Thinh T.Doan公司 , 卡罗琳·贝克 :
具有不确定性的动态网络上的分布式资源分配。 IEEE传输。 自动。 控制。 66 ( 9 ) : 4378-4384 ( 2021 ) [j5] Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 贾斯汀·隆伯格 :
随机量化下分布梯度方法的收敛速度:一种随机近似方法。 IEEE传输。 自动。 控制。 66 ( 10 ) : 4469-4484 ( 2021 ) [第17条] 尼鲁帕姆·古普塔 , Thinh T.Doan公司 , 尼丁·H·瓦迪亚 :
2f-冗余分散优化中的拜占庭容错。 行政协调会 2021 : 3632-3637 [第16条] 范泰姆·范 , Thinh T.Doan公司 , 丁和元 :
集群网络上的分布式双时间尺度方法。 行政协调会 2021 : 4625-4630 [第15条] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
分散随机逼近的有限时间分析及其在多智能体和多任务学习中的应用。 疾病预防控制中心 2021 : 2641-2646 [第14条] 马科斯·瓦康塞洛斯 , Thinh T.Doan公司 , 乌尔巴什·米特拉 :
随机量化下分布式双时间尺度梯度法的收敛速度改进。 疾病预防控制中心 2021 : 3117-3122 [第13条] Thinh T.Doan公司 :
非线性双时间尺度随机逼近:收敛性和有限时间性能。 L4DC(L4DC) 2021 : 47 [第12条] 坦莫·森 , 沈海英(Haiying Shen) , 瓦利德·萨阿德 , Thinh T.Doan公司 :
一个支持CPS的弹性和健壮的边缘云网络系统。 MASS(质量) 2021 : 234-242 [第11条] 曾思翰(Sihan Zeng) , 马利克·阿基尔·安瓦尔 , Thinh T.Doan公司 , 阿里吉特·雷乔杜里 , 贾斯汀·隆伯格 :
多任务强化学习的分散策略梯度方法。 阿拉伯联合酋长国 2021 : 1002-1012 [i19] 萨贾德·科达迪安 , Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 贾斯汀·隆伯格 :
二时间尺度自然行动者批判算法的有限样本分析。 CoRR公司 腹肌/2101.10506 ( 2021 ) [i18] Thinh T.Doan公司 :
马尔可夫噪声下非线性二时间尺度随机逼近的有限时间收敛速度。 CoRR公司 abs/2104.01627 ( 2021 ) [i17] 马科斯·瓦康塞洛斯 , Thinh T.Doan公司 , 乌尔巴什·米特拉 :
随机量化下分布式双时间尺度梯度法的收敛速度改进。 CoRR公司 abs/2105.14089 ( 2021 ) [i16] Subhonmesh Bose公司 , Hoa Dinh Nguyen先生 , 刘海天 , 叶过 , Thinh T.Doan公司 , 卡罗琳·贝克 :
基于平均的分布式对偶子梯度方法的分布式网格优化。 CoRR公司 abs/2107.07061 ( 2021 ) 【i15】 尼鲁帕姆·古普塔 , Thinh T.Doan公司 , 尼丁·H·瓦迪亚 :
2f-冗余下联邦本地SGD的拜占庭容错。 CoRR公司 abs/2108.11769 ( 2021 ) [第14条] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·罗姆伯格 :
一个双时间尺度随机优化框架及其在控制和强化学习中的应用。 CoRR公司 abs/2109.14756 ( 2021 ) [i13] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
约束马尔可夫决策过程在线原始-对偶自然行动者临界算法的有限时间复杂性。 CoRR公司 abs/2110.11383 ( 2021 ) [i12] Thinh T.Doan公司 :
求解非凸极小极大问题的二时间尺度梯度下降动力学的收敛速度。 CoRR公司 abs/2112.09579 ( 2021 ) 2020 [第10条] Thinh T.Doan公司 , 贾斯汀·隆伯格 :
分布式二时间尺度随机逼近的有限时间性能。 L4DC(L4DC) 2020 : 26-36 [i11] Thinh T.Doan公司 , 林明恩(Lam M.Nguyen) , Nhan H.Pham公司 , 贾斯汀·隆伯格 :
马尔可夫随机性下随机梯度下降的有限时间分析。 CoRR公司 abs/2003.10973 ( 2020 ) [i10] 曾思涵 , 阿基尔·安瓦尔 , Thinh T.Doan公司 , 贾斯汀·隆伯格 , 阿里吉特·雷乔杜里 :
多任务强化学习的分散策略梯度方法。 CoRR公司 abs/2006.04338 ( 2020 ) [第九章] Thinh T.Doan公司 :
局部随机逼近:联合学习和分布式多任务强化学习算法的统一视图。 CoRR公司 abs/2006.13460 ( 2020 ) [i8] 尼鲁帕姆·古普塔 , Thinh T.Doan公司 , 尼丁·H·瓦迪亚 :
最小冗余下分散优化中的拜占庭容错。 CoRR公司 abs/2009.14763 ( 2020 ) [i7] 范泰姆·范 , Thinh T.Doan公司 , 丁和元 :
集群网络上的分布式双时间尺度方法。 CoRR公司 abs/2010.00355 ( 2020 ) [i6] 曾思翰(Sihan Zeng) , Thinh T.Doan公司 , 贾斯汀·隆伯格 :
分散随机逼近的有限时间分析及其在多智能体和多任务学习中的应用。 CoRR公司 腹肌/2010.15088 ( 2020 ) [i5] Thinh T.Doan公司 :
非线性双时间尺度随机逼近:收敛性和有限时间性能。 CoRR公司 abs/2011.01868 ( 2020 )
2010 – 2019
2019 【j4】 Thinh T.Doan公司 , Subhonmesh Bose公司 , 丁和元 , 卡罗琳·贝克 :
镜像下降法中迭代的收敛性。 IEEE控制。 系统。 莱特。 三 ( 1 ) : 114-119 ( 2019 ) 【c9】 Thinh T.Doan公司 , 贾斯汀·隆伯格 :
线性二时间尺度随机逼近——有限时间分析。 阿勒顿 2019 : 399-406 【c8】 Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 贾斯汀·隆伯格 :
基于线性函数逼近的分布式TD(0)多智能体强化学习的有限时间分析。 ICML公司 2019 : 1626-1635 [i4] 陈再伟 , Sheng Zhang先生 , Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 约翰·保罗·克拉克 :
线性函数逼近Q-学习的有限时间分析。 CoRR公司 abs/1905.11425 ( 2019 ) [i3] Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 贾斯汀·隆伯格 :
线性函数逼近分布式时间差分学习的有限时间性能。 CoRR公司 abs/1907.12530 ( 2019 ) [i2] 皮埃特罗·皮耶保利 , Thinh T.Doan公司 , 贾斯汀·隆伯格 , 马格努斯·埃格斯泰德 :
多机器人行为排序的强化学习框架。 CoRR公司 abs/1909.05731 ( 2019 ) [i1] Thinh T.Doan公司 :
线性二时间尺度随机逼近的有限时间分析与重启方案。 CoRR公司 abs/1912.10583 ( 2019 ) 2018 【b1】 Thinh Thanh Doan公司 :
关于网络优化问题的分布式算法的性能。 美国伊利诺伊大学香槟分校, 2018 【c7】 Thinh T.Doan公司 , 卡罗琳·贝克 , R.斯里坎特 :
非一致时滞分布一致性的收敛速度。 ACSSC公司 2018 : 1294-1298 【c6】 Thinh T.Doan公司 , 西瓦·塞娅·马古鲁里 , 贾斯汀·罗姆伯格 :
关于量子化下分布式子梯度方法的收敛性。 阿勒顿 2018 : 567-574 [c5] Thinh T.Doan公司 :
在分布式优化中聚合随机梯度。 行政协调会 2018 : 2170-2175 【c4】 Thinh T.Doan公司 , 卡罗琳·贝克 , R.斯里坎特 :
通信延迟下分布式子梯度算法的收敛速度。 行政协调会 2018 : 5310-5315 【c3】 Thinh T.Doan公司 , 卡罗琳·贝克 , R.斯里坎特 :
通信延迟下有限和优化的分布梯度法的收敛速度。 SIGMETRICS(摘要) 2018 : 93-95 2017 [j3] Thinh T.Doan公司 , 卡罗琳·贝克 , R.斯里坎特 :
通信延迟条件下有限和优化的分布式梯度方法的收敛速度。 程序。 ACM测量。 分析。 计算。 系统。 1 ( 2 ) : 37:1-37:27 ( 2017 ) [注2] Thinh T.Doan公司 , 亚历克斯·奥尔舍夫斯基 :
二次时间动态网络上的分布式资源分配。 系统。 控制。 莱特。 99 : 57-63 ( 2017 ) [j1] Thinh T.Doan公司 , Subhonmesh Bose公司 , 卡罗琳·贝克 :
不确定电网联络线调度的分布式拉格朗日方法。 SIGMETRICS执行评估版本。 45 ( 2 ) : 88-90 ( 2017 ) 【c2】 Thinh T.Doan公司 , 卡罗琳·贝克 :
网络资源分配的分布式拉格朗日方法。 CCTA公司 2017 : 650-655 2012 【c1】 Thinh Thanh Doan公司 , Choon Yik Tang先生 :
连续时间约束分布式凸优化。 Allerton会议 2012 : 1482-1489