亚哲牛
人员信息
优化列表
2020年–今天
2024 【c6】 张银敏(音) , 刘杰(音译) , 李楚明 , 亚哲牛 , 杨耀东 , 于柳 , 万里欧阳 :
离线到在线强化学习的Q值估计透视。 AAAI公司 2024 : 16908-16916 [i6] 春雨轩 , 亚哲牛 , 袁璞 , 帅虎 , 于柳 , 泾阳 :
ReZero:通过实时和快速重新分析提升基于MCTS的算法。 CoRR公司 abs/2404.16364 ( 2024 ) 2023 【c5】 李楚明 , 刘杰(音译) , 张银敏(音) , 余洪伟 , 亚哲牛 , 杨耀东 , 于柳 , 万里欧阳 :
ACE:具有双向动作依赖性的多智能体协作Q学习。 AAAI公司 2023 : 8536-8544 [c4] 李楚明 , 阮佳 , 刘杰(音译) , 张银敏(音) , 亚哲牛 , 杨耀东 , 于柳 , 万里欧阳 :
从基于模型的规划中提取的理论保证政策改进。 ECAI公司 2023 : 1381-1388 【c3】 张明(Ming Zhang) , Shenghan Zhang先生 , 杨振杰 , 陈乐凯 , 郑金良 , 朝阳 , 李楚明 , 杭州 , 亚哲牛 , 于柳 :
GoBigger:合作竞争多智能体交互仿真的可扩展平台。 ICLR公司 2023 【c2】 亚哲牛 , 袁璞 , 杨振杰 , 李雪燕 , 通州 , 任济源 , 帅虎 , 李洪生 , 于柳 :
LightZero:一般顺序决策场景中蒙特卡罗树搜索的统一基准。 NeurIPS公司 2023 [i5] 李楚明 , 阮佳 , 刘杰(音译) , 张银敏(音) , 亚哲牛 , 杨耀东 , 于柳 , 欧阳万里 :
从基于模型的规划中提取的理论保证政策改进。 CoRR公司 abs/2307.12933 ( 2023 ) [i4] 亚哲牛 , 袁璞 , 杨振杰 , 李雪燕 , 通州 , 任济源 , 帅虎 , 李洪生 , 于柳 :
LightZero:一般顺序决策场景中蒙特卡罗树搜索的统一基准。 CoRR公司 abs/2310.08348 ( 2023 ) [i3] 张银敏(音) , 刘杰(音译) , 李楚明 , 亚哲牛 , 杨耀东 , 于柳 , 万里欧阳 :
离线到在线强化学习的Q值估计透视。 CoRR公司 abs/2312.07685 ( 2023 ) 2022 [i2] 李楚明 , 刘杰(音译) , 张银敏(音) , 余洪伟 , 亚哲牛 , 杨耀东 , 于柳 , 万里欧阳 :
ACE:具有双向动作依赖性的多智能体协作Q学习。 CoRR公司 abs/2211.16068 ( 2022 )
2010 – 2019
2019 【c1】 张凯(Kai Zhang) , 楠楠 , 李成华 , 邹学毅 , 宁康 , 詹旺 , Hang Xu(徐航) , 王朝峰 , 郑丽 , 王林林(Linlin Wang) , 史骏 , 顾树行 , 孙文宇 , 志强郎 , 聂江涛 , 魏伟 , 张磊 , 亚哲牛 , 裴金卓 , 香港香镇 , 长阳 , 王文浩 , 拉杜·蒂莫夫特 , 郑辉 , 王秀梅 , 高新波 , 熊东良 , 刘帅(Shuai Liu) , 瑞鹏港 :
AIM 2019关于约束超分辨率的挑战:方法和结果。 ICCV研讨会 2019 : 3565-3574号 [i1] 张凯(Kai Zhang) , 顾树行 , 拉杜·蒂莫夫特 , 郑辉 , 王秀梅 , 高新波 , 熊东良 , 刘帅(Shuai Liu) , 瑞鹏港 , 楠楠 , 李成华 , 邹学毅 , 宁康 , 詹旺 , Hang Xu(徐航) , 王朝峰 , 郑丽 , 王林林(Linlin Wang) , 史骏 , 孙文宇 , 志强郎 , 聂江涛 , 魏伟 , 张磊 , 亚哲牛 , 裴金卓 , 香港香镇 , 长阳 , 王文浩 :
AIM 2019关于约束超分辨率的挑战:方法和结果。 CoRR公司 腹肌/1911.01249 ( 2019 )