罗海鹏

IBM早期职业主席兼副教授
托马斯·洛德计算机科学系
南加州大学

办公室：SAL 216
电子邮件：haipengl at usc dot edu

关于我

我是托马斯·洛德计算机科学系在南加州大学之前我在微软研究院，纽约市博士后研究员。我从普林斯顿大学我很幸运地得到了罗伯·夏皮雷并与埃拉·哈赞。我在获得学士学位北京大学与教授合作甄晓.

研究兴趣

我的研究兴趣是开发具有强大理论保证的实用机器学习算法，重点是

在线学习
土匪问题
强化学习
在游戏中学习
快速可扩展的优化方法

我的一些代表性论文见下文（可以找到完整列表在这里或在谷歌学者).

代表性论文

[柯尔特2021 最佳论文奖]无先验知识的非静态强化学习：一种最优黑盒方法。
陈玉伟和罗海鹏。

[NeurIPS 2021 口腔]两全其美：具有未知转换的随机和对抗性情节MDP。
金天成、黄龙波和罗海鹏。

[NeurIPS 2020 口腔] 不再有偏见：高概率数据依赖于对手强盗和MDP的遗憾界限。
李忠伟、罗海鹏、魏晨瑜和张梦晓。

[2018年COLT 最佳学生论文奖]逻辑回归：不当的重要性。
Dylan J.Foster、Satyen Kale、Haipeng Luo、Mehryar Mohri和Karthik Sridharan。

[柯尔特2018]对抗强盗的更多自适应算法。
陈玉伟和罗海鹏。

[2017年COLT]串连一组Bandit算法。
阿列克·阿加瓦尔、罗海鹏、贝纳姆·尼沙布尔和罗伯特·夏皮雷。

[NeurIPS 2015 最佳论文奖]游戏中规则化学习的快速融合。
瓦西里斯·锡尔甘尼（Vasilis Syrgkanis）、阿列克·阿加瓦尔（Alekh Agarwal）、罗海鹏（Haipeng Luo）和罗伯特·夏皮雷（Robert E.Schapire）。

[ICML 2015年 最佳论文奖] 在线增压的优化和自适应算法。
Alina Beygelzimer、Satyen Kale和Haipeng Luo。

[COLT 2015年]无参数实现所有：AdaNormalHedge。
罗海鹏（Haipeng Luo）和罗伯特·夏皮雷（Robert E.Schapire）。