郑海雪
人员信息
优化列表
2020年–今天
2024 [i10] 郑龙涛 , 黄志远 , 郑海雪 , 王欣润(Xinrun Wang) , 保安 , 水城岩 以下为:
AgentStudio:构建通用虚拟代理的工具包。 CoRR公司 abs/2403.17918 ( 2024 ) [i9] 萨法·梅萨乌德 , 比勒尔·莫克德姆 , 薛正海 , 林西·庞 , 保安 , 陈海鹏 , 桑贾伊·朝拉 以下为:
S公司 2 AC:Stein Soft影评人基于能量的强化学习。 CoRR公司 abs/2405.00987 ( 2024 ) 2023 [j1] 李全一 , 彭正浩 , 兰峰 , 张启航(Qihang Zhang) , 郑海雪 , 周伯雷 以下为:
MetaDrive:为可概括强化学习编写各种驾驶场景。 IEEE传输。 模式分析。 机器。 智力。 45 ( 三 ) 以下为: 3461-3475 ( 2023 ) 【c5】 郑海雪 , 彭正浩 , 李全一 , 刘志翰 , 周伯雷 以下为:
在线演示不完善的保护策略优化。 ICLR公司 2023 [c4] Wanqi薛 , 蔡庆鹏 , 薛正海 , 朔阳 , 刘树昌 , 董正 , 彭江 , 坤盖 , 博安 以下为:
PrefRec:推荐具有人类偏好的系统,以增强长期用户参与度。 KDD公司 2023 以下为: 2008年4月28日 【c3】 薛正海 , 蔡庆鹏 , 刘树昌 , 董正 , 彭江 , 坤盖 , 保安 以下为:
动态移位数据的状态正则化策略优化。 NeurIPS公司 2023 【c2】 蔡庆鹏 , 郑海雪 , 张驰(Chi Zhang) , Wanqi薛 , 刘树昌 , 若翰战 , 王雪亮 , 左天佑 , 谢文涛 , 董正 , 彭江 , 坤盖 以下为:
短视频推荐的两阶段受限演员评论。 万维网 2023 以下为: 865-875 [i8] 蔡庆鹏 , 郑海雪 , 张驰(Chi Zhang) , Wanqi薛 , 刘树昌 , 若翰战 , 王雪亮 , 左天游 , 谢文涛 , 董正 , 彭江 , 坤盖 以下为:
短视频推荐的两阶段受限演员评论。 CoRR公司 abs/2302.01680 ( 2023 ) [i7] 郑海雪 , 彭正浩 , 李全一 , 刘志翰 , 周伯雷 以下为:
在线演示不完善的保护策略优化。 CoRR公司 abs/2303.01728 ( 2023 ) [i6] 郑海雪 , 蔡庆鹏 , 刘树昌 , 董正 , 彭江 , 坤盖 , 保安 以下为:
动态移位数据的状态正则化策略优化。 CoRR公司 abs/2306.03552 ( 2023 ) [i5] 岳峰 , 刘树昌 , 郑海雪 , 蔡庆鹏 , 兰道湖 , 彭江 , 坤盖 , 孙飞 以下为:
一个大型语言模型增强的会话推荐系统。 CoRR公司 abs/2308.06212 ( 2023 ) [i4] 郑海雪 , 蔡庆鹏 , 左天游 , 杨斌(Bin Yang) , 兰道湖 , 彭江 , 坤盖 , 保安 以下为:
AdaRec:增强长期用户参与度的自适应顺序建议。 CoRR公司 abs/2310.03984 ( 2023 ) 2022 [i3] Wanqi薛 , 蔡庆鹏 , 郑海雪 , 朔阳 , 刘树昌 , 董正 , 彭江 , 保安 以下为:
PrefRec:增强长期用户参与度的基于偏好的推荐系统。 CoRR公司 abs/2212.02779 ( 2022 ) 2021 【c1】 刘旭辉 , 郑海雪 , 京城庞 , 盛毅江 , 冯旭 , 杨宇 以下为:
非政策强化学习中的后悔最小化经验重播。 NeurIPS公司 2021 以下为: 17604-17615 [i2] 郑海雪 , 刘旭辉 , 京城庞 , 盛毅江 , 冯旭 , 杨宇 以下为:
后悔最小化体验重播。 CoRR公司 abs/2105.07253 ( 2021 ) [i1] 李全一 , 彭正浩 , 郑海雪 , 张启航(Qihang Zhang) , 周伯雷 以下为:
MetaDrive:为可概括强化学习编写各种驾驶场景。 CoRR公司 abs/2109.12674 ( 2021 )