毛伟超
人员信息
优化列表
2020年–今天
2024 [i10] 毛伟超 , 邱浩然 , 陈旺 , 休伯特·弗兰克 , Zbigniew Kalbarczyk公司 , 塔梅尔·巴萨尔 :
Õ(T -1 )全信息广义和马尔可夫对策中的(粗)相关均衡收敛性。 CoRR公司 abs/2403.07890 ( 2024 ) [第九章] 张向元 , 毛伟超 , 邱浩然 , 塔梅尔·巴萨尔 :
决策变换器作为部分可观测连续控制的基础模型。 CoRR公司 abs/2404.02407 ( 2024 ) [i8] 邱浩然 , 毛伟超 , 阿奇特·帕克 , 崔胜坤 , Saurabh Jha公司 , 陈旺 , 休伯特·弗兰克 , Zbigniew T.Kalbarczyk公司 , 塔梅尔·巴萨尔 , 拉维山卡·K·伊耶 :
基于代理模型的序列长度预测的高效交互式LLM服务。 CoRR公司 abs/2404.08509 ( 2024 ) 2023 [注2] 毛伟超 , 塔梅尔·巴萨尔 :
分散广义和马尔可夫对策中的有效强化学习。 动态。 游戏应用程序。 13 ( 1 ) : 165-186 ( 2023 ) [第15条] 毛伟超 , 邱浩然 , 陈旺 , 休伯特·弗兰克 , Zbigniew Kalbarczyk公司 , 拉维山卡·K·伊耶 , 塔梅尔·巴萨尔 :
多智能体元强化学习:任务相似性的收敛速度更快。 NeurIPS公司 2023 [第14条] 邱浩然 , 毛伟超 , 陈旺 , 休伯特·弗兰克 , 阿拉·优素福 , Zbigniew T.Kalbarczyk公司 , 塔梅尔·巴萨尔 , 拉维山卡·K·伊耶 :
AWARE:通过生产云系统中的强化学习自动调整工作负载。 USENIX年度技术会议 2023 : 387-402 [i7] 毛伟超 , 鲁塔·德赛 , 迈克尔·路易斯·尤佐利诺 , 尼丁·卡姆拉 :
用于学习程序任务的可计划表示的动作动力学任务图。 CoRR公司 腹肌/2302.05330 ( 2023 ) [i6] 张向远 , 毛伟超 , 萨维兹·莫拉维 , 穆哈辛·本诺曼 , 塔梅尔·巴萨尔 :
Control健身房:用于基准强化学习算法的大规模安全关键控制环境。 CoRR公司 abs/2311.18736 ( 2023 ) 2022 [第13条] 邱浩然 , 毛伟超 , 阿奇特·帕克 , 陈旺 , 休伯特·弗兰克 , Zbigniew T.Kalbarczyk公司 , 塔梅尔·巴萨尔 , 拉维山卡·K·伊耶 :
SIMPPO:用于无服务器资源管理的可扩展增量在线学习框架。 SoCC公司 2022 : 306-322 [第12条] 邱浩然 , 毛伟超 , 阿奇特·帕克 , 陈旺 , 休伯特·弗兰克 , Zbigniew T.Kalbarczyk公司 , 塔梅尔·巴萨尔 , 拉维山卡·K·伊耶 :
多租户无服务器平台中资源管理的强化学习。 EuroMLSys@EuroSys 2022 : 20-28 [第11条] 毛伟超 , 林阳(Lin Yang) , 张开清 , 塔梅尔·巴萨尔 :
分散多智能体强化学习无模型算法的改进。 ICML公司 2022 : 15007-15049 [第10条] 毛伟超 , 邱浩然 , 陈旺 , 休伯特·弗兰克 , Zbigniew Kalbarczyk公司 , 拉维山卡·K·伊耶 , 塔梅尔·巴萨尔 :
基于函数逼近的云资源管理中场博弈方法。 NeurIPS公司 2022 2021 【c9】 苏杰·巴特 , 毛伟超 , 亚历克·科佩尔 , 塔梅尔·巴萨尔 :
不完全信息下策略搜索的半参数信息状态嵌入。 疾病预防控制中心 2021 : 4501-4506 【c8】 毛伟超 , 张开清 , 朱瑞浩 , 大卫·辛奇·列维 , 塔梅尔·巴萨尔 :
非平稳情节MDP中的近最优无模型强化学习。 ICML公司 2021 : 7447-7458 [i5] 毛伟超 , 塔梅尔·巴萨尔 :
分散广义和马尔可夫对策中的有效强化学习。 CoRR公司 abs/2110.05682 ( 2021 ) [i4] 毛伟超 , 塔梅尔·巴萨尔 , 林F.杨 , 张开清 :
分散合作多智能体强化学习与探索。 CoRR公司 abs/2110.05707 ( 2021 ) 2020 【c7】 毛伟超 , 张开清 , 埃里克·米林 , 塔梅尔·巴萨尔 :
部分可观测协作多智能体强化学习中的信息状态嵌入。 疾病预防控制中心 2020 : 6124-6131 【c6】 毛伟超 , 张开清 , 谢巧敏 , 塔梅尔·巴萨尔 :
POLY-HOOT:连续空间MDP中的蒙特卡罗规划,带非症状分析。 NeurIPS公司 2020 [i3] 毛伟超 , 张开清 , 埃里克·米林 , 塔梅尔·巴萨尔 :
部分可观测协作多智能体强化学习中的信息状态嵌入。 CoRR公司 abs/2004.01098 ( 2020 ) [i2] 毛伟超 , 张开清 , 谢巧敏 , 塔梅尔·巴萨尔 :
POLY-HOOT:连续空间MDP中的蒙特卡罗规划,带非症状分析。 CoRR公司 abs/2006.04672 ( 2020 ) [i1] 毛伟超 , 张开清 , 朱瑞浩 , 大卫·辛奇·列维 , 塔梅尔·巴萨尔 :
非平稳情节MDP中无模型RL的近最优回归界。 CoRR公司 abs/2010.03161 ( 2020 )
2010 – 2019
2019 [j1] 钱世友 , 曹健 , 毛伟超 , 朱延敏(Yanmin Zhu) , 于佳迪 , 李明露 , 王杰(音译) :
一种用于基于内容的发布/订阅系统的快速反匹配匹配算法。 计算。 网络 149 : 213年至225年 ( 2019 ) 【c5】 郑振哲 , 毛伟超 , 范武 , 陈桂海 :
物联网数据市场的挑战和机遇。 CPSIoTWeek的SocialSens 2019 : 1-2 【c4】 毛伟超 , 郑振哲 , 范武 :
物联网数据市场收入最大化定价:信息设计视角。 信息通信 2019 : 1837-1845 【c3】 钱世友 , 毛伟超 , 曹健 , 弗雷德里克·勒穆埃尔 , 李明露 :
调整匹配算法以适应基于内容的发布/订阅系统中的工作负载波动。 信息通信 2019 : 1936-1944 2018 【c2】 毛伟超 , 郑振哲 , 范武 , 陈桂海 :
未知时间折扣估值的收入最大化在线定价。 国际JCAI 2018 : 440-446 【c1】 毛伟超 , 曹健 , 薛广涛 , 贾迪余 , 朱延敏(Yanmin Zhu) , 李明露 , 李文娟 , 钱世友 :
调整匹配算法以适应基于内容的发布/订阅系统中的动态订阅。 ISPA/IUCC/BDCloud/SocialCom/SustainCom 2018 : 369-376年