罗海鹏

罗海鹏 

IBM早期职业主席兼副教授
托马斯·洛德计算机科学系
南加州大学

办公室:SAL 216
电子邮件:haipengl at usc dot edu

关于我

我是托马斯·洛德计算机科学系南加州大学之前我在微软研究院,纽约市博士后研究员。我从普林斯顿大学我很幸运地得到了罗伯·夏皮雷并与埃拉·哈赞。我在获得学士学位北京大学与教授合作甄晓.

研究兴趣

我的研究兴趣是开发具有强大理论保证的实用机器学习算法,重点是

  • 在线学习

  • 土匪问题

  • 强化学习

  • 在游戏中学习

  • 快速可扩展的优化方法

我的一些代表性论文见下文(可以找到完整列表在这里或在谷歌学者).

代表性论文

  • [柯尔特2021 最佳论文奖]无先验知识的非静态强化学习:一种最优黑盒方法。
    陈玉伟和罗海鹏。

  • [NeurIPS 2021 口腔]两全其美:具有未知转换的随机和对抗性情节MDP。
    金天成、黄龙波和罗海鹏。

  • [NeurIPS 2020 口腔] 不再有偏见:高概率数据依赖于对手强盗和MDP的遗憾界限。
    李忠伟、罗海鹏、魏晨瑜和张梦晓。

  • [2018年COLT 最佳学生论文奖]逻辑回归:不当的重要性。
    Dylan J.Foster、Satyen Kale、Haipeng Luo、Mehryar Mohri和Karthik Sridharan。

  • [柯尔特2018]对抗强盗的更多自适应算法。
    陈玉伟和罗海鹏。

  • [2017年COLT]串连一组Bandit算法。
    阿列克·阿加瓦尔、罗海鹏、贝纳姆·尼沙布尔和罗伯特·夏皮雷。

  • [NeurIPS 2015 最佳论文奖]游戏中规则化学习的快速融合。
    瓦西里斯·锡尔甘尼(Vasilis Syrgkanis)、阿列克·阿加瓦尔(Alekh Agarwal)、罗海鹏(Haipeng Luo)和罗伯特·夏皮雷(Robert E.Schapire)。

  • [ICML 2015年 最佳论文奖] 在线增压的优化和自适应算法。
    Alina Beygelzimer、Satyen Kale和Haipeng Luo。

  • [COLT 2015年]无参数实现所有:AdaNormalHedge。
    罗海鹏(Haipeng Luo)和罗伯特·夏皮雷(Robert E.Schapire)。