王子凡;沈毅;迈克尔·M·扎夫拉诺斯。;卡尔·约翰逊。 风险规避博弈中纳什均衡的学习。 arXiv公司:2403.10399 预印本,arXiv:2403.10399[math.OC](2024)。 BibTeX公司 引用 \textit{Z.Wang}等人,“风险规避游戏中纳什均衡的学习”,预印本,arXiv:2403.10399[math.OC](2024) 全文: arXiv公司 OA许可证
王子凡;高玉龙;王思毅;迈克尔·M·扎夫拉诺斯。;亚历山德罗·阿巴特;卡尔·约翰逊。 分布式LQR(扩展版)中的政策评估。 arXiv公司:2401.10240 预打印,arXiv:2401.10240[math.OC](2023)。 BibTeX公司 引用 \textit{Z.Wang}等人,“分配LQR(扩展版)中的政策评估”,预印本,arXiv:2401.10240[math.OC](2023) 全文: arXiv公司 OA许可证
王子凡;刘长新;托马斯·帕里西尼;迈克尔·M·扎夫拉诺斯。;卡尔·约翰逊。 具有决策相关分布的约束优化。 arXiv:2310.02384号 预印本,arXiv:2310.02384[math.OC](2023)。 BibTeX公司 引用 \textit{Z.Wang}等人,“具有决策相关分布的约束优化”,预打印,arXiv:2310.02384[math.OC](2023) 全文: arXiv公司 OA许可证
王子凡;Yi、Xinlei;沈毅;迈克尔·M·扎夫拉诺斯。;卡尔·约翰逊。 在线凸游戏中的非对称反馈学习。 arXiv:2307.08812 预印本,arXiv:2307.08812[math.OC](2023)。 BibTeX公司 引用 \textit{Z.Wang}等人,“在线凸游戏中的非对称反馈学习”,预打印,arXiv:2307.08812[math.OC](2023) 全文: arXiv公司 OA许可证