停止战争！

Остановите войну!

对于科学家：

默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

于白0017

>主页 >珀森斯

人员信息

附属： Salesforce Research，美国加利福尼亚州帕洛阿尔托
从属关系（2019年博士）： 斯坦福大学，加利福尼亚州，美国

其他同名人员

请参阅常见问题解答

其他同名人员

请参阅常见问题解答

为什么有些名字后面跟着一个四位数的数字？

优化列表

优化激活！

放大了??属于??记录

查看优化列表

导出优化列表为

显示全部 ??记录

2020年–今天

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2023
[公元35年]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/colt/WangL0023
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/colt/WangL0023
王元浩,刘庆华,于白,池瑾（Chi Jin）:
打破多代理诅咒：具有函数逼近的高效分散多代理RL。 COLT公司 2023:2793-2848
[c34]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/0004K0023
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icr/0004K0023
王元浩,丁文孔,于白,池瑾（Chi Jin）:
在多人游戏中学习合理化均衡。 ICLR公司 2023
[公元33年]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/陈023
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/Chen0M23
范晨,于白,宋梅:
具有B-稳定性的部分可观测RL：统一的结构条件和尖锐的样本效率算法。 ICLR公司 2023
[c32]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/XieF00K23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/CieF00K23
谢腾阳,迪伦·福斯特,于白,南江,沙姆·M·卡卡德:
报道在在线强化学习中的作用。 ICLR公司 2023
[公元31年]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/BhatnagarWX023
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/BhatnagarWX023
Aadyot Bhatnagar公司,Huan Wang（王欢）,熊才明,于白:
通过强自适应在线学习改进在线保形预测。 ICML公司 2023:2337-2363年
[公元30年]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/陈WXMB23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/ChenWXMB23网址
范晨,Huan Wang（王欢）,熊才明,宋梅,于白:
揭示POMDP的学习下限。 ICML公司 2023:5104-5161
[公元29年]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/BaiCWXM23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BaiCWXM23
于白,范晨,Huan Wang（王欢）,熊才明,宋梅:
变形金刚作为统计学家：可证明的上下文内学习与上下文内算法选择。 NeurIPS公司 2023
[c28]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/Chen0PW23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/Chen0PW23
陈敏硕,于白,H.文森特·普尔,王梦迪:
可观测性受损的有效RL：学会处理延迟和缺失的状态观测。 NeurIPS公司 2023
[公元27年]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/Fu00M23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/Fu00M23
Hengyu Fu公司,郭天宇,于白,宋梅:
单个注意力层可以学到什么？通过随机特征透镜进行的研究。 NeurIPS公司 2023
[i42]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2302-01333
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2302-01333
范晨,Huan Wang（王欢）,熊才明,宋梅,于白:
揭示POMDP的学习下限。 CoRR公司 abs/2302.01333(2023)
[i41]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2302-06606
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2302-06606
王元浩,刘庆华,于白,池瑾（Chi Jin）:
打破多代理诅咒：具有函数逼近的高效分散多代理RL。 CoRR公司腹肌/2302.06606(2023)
[i40]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2302-07869
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2302-07869
Aadyot Bhatnagar公司,Huan Wang（王欢）,熊才明,于白:
通过强自适应在线学习改进在线保形预测。 CoRR公司 abs/2302.07869(2023)
[i39]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日志/corr/abs-2306-01243
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2306-01243
陈敏硕,于白,H.文森特·普尔,王梦迪:
可观测性受损的有效RL：学会处理延迟和缺失的状态观测。 CoRR公司 abs/2306.01243(2023)
[i38]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2306-04637
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2306-04637
于白,范晨,Huan Wang（王欢）,熊才明,宋梅:
变形金刚作为统计学家：可证明的上下文内学习与上下文内算法选择。 CoRR公司 abs/2306.04637(2023)
[i37]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/cor/abs-2307-02884
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2307-02884
郭嘉诚,陈敏硕,Huan Wang（王欢）,熊才明,王梦迪,于白:
事后多观察POMDP的样本有效学习。 CoRR公司 abs/2307.02884(2023)
[公元36年]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2307-11353
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2307-11353
Hengyu Fu公司,郭天宇,于白,宋梅:
单个注意力层可以学到什么？通过随机特征透镜进行的研究。 CoRR公司腹肌/2307.11353(2023)
[i35]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2310-08566
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2310-08566
李宗林,于白,宋梅:
变形金刚作为决策者：通过有监督的预训练进行可证明的上下文强化学习。 CoRR公司 abs/2310.08566(2023)
[i34]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2310-10616
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-230-10616
郭天宇,胡伟,宋梅,Huan Wang（王欢）,熊才明,西尔维奥·萨瓦雷斯,于白:
变形金刚如何学习简单函数以外的上下文？用表征学习的案例研究。 CoRR公司腹肌/2310.10616(2023)
[i33]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2312-00054
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2312-00054
雷昭（Lei Zhao）,王梦迪,于白:
反向强化学习比标准强化学习难吗？ CoRR公司 abs/2312.00054(2023)
2022
[公元26年]
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/emnlp/ChoubeyBWLR22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/emnlp/ChoubeyBWLR22
普拉福拉·库马尔·乔比,于白,吴建胜,刘文浩,纳兹尼·拉贾尼:
用于提高零镜头文本分类效率的保角预测器。 EMNLP公司 2022:3027-3034
[公元25年]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/BaiMWZX22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icr/BaiMWZX22
于白,宋梅,Huan Wang（王欢）,周英波,熊才明:
具有一般函数类的高效可微保角预测。 ICLR公司 2022
[公元24年]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/SongMB22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/SongMB22
Ziang Song公司,宋梅,于白:
我们什么时候才能充分学习具有大量参与者样本的广义Sum Markov对策？ ICLR公司 2022
【c23】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/BaiJMY22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/BaiJMY22
于白,池瑾（Chi Jin）,宋梅,天成余:
具有不完全信息的广义形式博弈的近似最优学习。 ICML公司 2022:1337-1382
[公元22年]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/00170MSY22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/00170MSY22
于白,池瑾（Chi Jin）,宋梅,Ziang Song公司,天成余:
通过在线镜像下降实现大规模游戏中的高效Phi-Regret最小化。 NeurIPS公司 2022
【c21】
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/Nichani0L22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/Nichani0L22
埃沙安·尼查尼,于白,杰森·D·李:
识别好的方向以避开NTK机制并有效地学习低阶加稀疏多项式。 NeurIPS公司 2022
[公元20年]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/SongM022
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/SongM022
Ziang Song公司,宋梅,于白:
广义博弈中相关均衡的样本有效学习。 NeurIPS公司 2022
[第19条]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/ZhangLWX0022
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/ZhangLWX0022
张润宇（音）,刘庆华,Huan Wang（王欢）,熊才明,李娜（Na Li）,于白:
马尔可夫博弈的策略优化：统一框架和更快的收敛。 NeurIPS公司 2022
[第18条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/uai/LouBBZWXSESP22会议
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/uai/LouBBZWXSESP22
罗秀好,Aadyot Bhatnagar公司,于白,赵胜佳,Huan Wang（王欢）,熊才明,西尔维奥·萨瓦雷斯,斯特凡诺·埃尔蒙,爱德华·施默林,马可·帕沃内:
本地校准：量度和重新校准。阿拉伯联合酋长国 2022:1286-1295
[i32]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2202-01752
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2202-01752
于白,池瑾（Chi Jin）,宋梅,天成余:
不完全信息下广义博弈的近最优学习。 CoRR公司 abs/2202.01752(2022)
[i31]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2202-11091
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2202-11091
于白,宋梅,Huan Wang（王欢）,周英波,熊才明:
具有一般函数类的高效可微保角预测。 CoRR公司 abs/2202.11091(2022)
[i30]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2205-07223
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2205-07223
宋子昂,宋梅,于白:
广义博弈中相关均衡的样本有效学习。 CoRR公司 abs/2205.07223(2022)
[i29]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2205-15294
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2205-15294
于白,池瑾（Chi Jin）,宋梅,Ziang Song公司,天成余:
通过在线镜像下降实现大规模游戏中的高效Φ-后悔最小化。 CoRR公司腹肌/2205.15294(2022)
[第28条]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2206-02640
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-02640
张润宇（音）,刘庆华,Huan Wang（王欢）,熊才明,李娜（Na Li）,于白:
马尔可夫博弈的策略优化：统一框架和更快的收敛。 CoRR公司 abs/2206.02640(2022)
[i27]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2206-03688
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-03688
埃沙安·尼查尼,于白,杰森·D·李:
识别好的方向以避开NTK机制，并有效地学习低阶加稀疏多项式。 CoRR公司腹肌/2206.03688(2022)
[i26]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2209-11745
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2209-11745
范晨,宋梅,于白:
具有决策估计系数的RL统一算法：无偏差、PAC和无回报学习。 CoRR公司 abs/2209.11745(2022)
[i25]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2209-14990
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2209-14990
范晨,于白,宋梅:
具有B-稳定性的部分可观测RL：统一的结构条件和尖锐的样本效率算法。 CoRR公司 abs/2209.14990(2022)
【i24】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-220-04157
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-220-04157
谢腾阳,迪伦·福斯特,于白,南江,沙姆·M·卡卡德:
报道在在线强化学习中的作用。 CoRR公司 abs/2210.04157(2022)
[第23条]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-220-11402
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2210-11402
王元浩,丁文孔,于白,池瑾（Chi Jin）:
在多人游戏中学习合理化均衡。 CoRR公司 abs/2210.11402(2022)
[i22]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-220-12619
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-220-12619
普拉福拉·库马尔·乔比,于白,吴建胜,刘文浩,纳兹尼·拉贾尼:
共形预测器用于提高零炮文本分类效率。 CoRR公司 abs/2210.12619(2022)
2021
[第17条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/aistats/YinBW21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aistats/YinBW21
明音,于白,王玉祥:
用于强化学习的离线策略评估中的近似最优可证明一致收敛。 AISTATS公司 2021:1567-1575
[第16条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/BaiCZLKWX21型
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/BaiCZLKWX21
于白,陈敏硕,潘舟,拓兆,杰森·D·李,沙姆·M·卡卡德,Huan Wang（王欢）,熊才明:
培训验证在元学习中的拆分有多重要？ ICML公司 2021:543-553
[第15条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/BaiMWX21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/BaiMWX21
于白,宋梅,Huan Wang（王欢）,熊才明:
不要因为过度自信而责怪过度参数化：二元分类中校准的理论分析。 ICML公司 2021:566-576
[第14条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/LiuYBJ21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/LiuYBJ21
刘庆华,天成余,于白,池瑾（Chi Jin）:
对基于模型的自我游戏强化学习的深入分析。 ICML公司 2021:7001-7010
[第13条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/YangBM21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/YangBM21
梓潼杨,于白,宋梅:
随机特征模型中泛化误差和一致收敛之间的精确差距。 ICML公司 2021:11704-11715
[第12条]
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/YinBW21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/YinBW21
明音,于白,王玉祥:
基于双方差约简的近最优离线强化学习。 NeurIPS公司 2021:7677-7688
[第11条]
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/BaiMWX21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BaiMWX21
于白,宋梅,Huan Wang（王欢）,熊才明:
了解不确定性估计中的覆盖不足偏差。 NeurIPS公司 2021:18307-18319
[第10条]
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/BaiJWX21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BaiJWX21
于白,池瑾（Chi Jin）,Huan Wang（王欢）,熊才明:
广义Sum博弈中Stackelberg均衡的样本有效学习。 NeurIPS公司 2021:25799-25811
【c9】
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/XieJWXB21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/XieJWXB21
谢腾阳,南江,Huan Wang（王欢）,熊才明,于白:
政策微调：桥接样本高效的离线和在线强化学习。 NeurIPS公司 2021:27395-27407
【i21】
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2102-01748
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2102-01748
明音,于白,王玉祥:
基于双方差约简的近最优离线强化学习。 CoRR公司 abs/2102.01748(2021)
[i20]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2102-07856
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2102-07856
于白,宋梅,Huan Wang（王欢）,熊才明:
不要仅仅因为过度自信而指责过度参数化：二进制分类中校准的理论分析。 CoRR公司 abs/2102.07856(2021)
[i19]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2102-10809
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2102-10809
罗秀好,Aadyot Bhatnagar公司,Huan Wang（王欢）,熊才明,西尔维奥·萨瓦雷斯,于白,赵胜佳,斯特凡诺·埃尔蒙:
本地化校准：量度和重新校准。 CoRR公司 abs/2102.10809(2021)
[i18]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2102-11494
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2102-11494
于白,池瑾（Chi Jin）,Huan Wang（王欢）,熊才明:
广义Sum博弈中Stackelberg均衡的样本有效学习。 CoRR公司腹肌/2102.11494(2021)
[i17]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2103-04554
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2103-04554
梓潼杨,于白,宋梅:
随机特征模型中泛化误差和一致收敛之间的精确差距。 CoRR公司 abs/2103.04554(2021)
[i16]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2106-04895
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2106-04895
谢腾阳,南江,Huan Wang（王欢）,熊才明,于白:
政策微调：架起高效样本离线和在线强化学习的桥梁。 CoRR公司 abs/2106.04895(2021)
【i15】
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日志/corr/abs-2106-05515
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2106-05515
于白,宋梅,Huan Wang（王欢）,熊才明:
了解不确定度估计中的覆盖不足偏差。 CoRR公司 abs/2106.05515(2021)
[第14条]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-210-04184
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-210-04184
Ziang Song公司,宋梅,于白:
我们什么时候才能充分学习具有大量参与者样本的广义Sum Markov对策？ CoRR公司 abs/2110.04184(2021)
2020
[c8]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/BaiL20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/BaiL20
于白,杰森·D·李:
超越线性化：关于宽神经网络的二次逼近和高阶逼近。 ICLR公司 2020
【c7】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/BaiJ20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/BaiJ20
于白,池瑾（Chi Jin）:
竞争强化学习的可证明自演算法。 ICML公司 2020:551-560
【c6】
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/BaiJY20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BaiJY20
于白,池瑾（Chi Jin）,天成余:
具有自我游戏的近最优强化学习。 NeurIPS公司 2020
【c5】
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/ChenBLZWXS20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/ChenBLZWXS20
陈敏硕,于白,杰森·D·李,拓兆,Huan Wang（王欢）,熊才明,理查德·索彻:
理解分层学习：神经表征的好处。 NeurIPS公司 2020
[i13]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2002-04010
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2002-04010
于白,本·克劳斯,Huan Wang（王欢）,熊才明,理查德·索彻:
泰勒化训练：在有限宽度上更好地逼近神经网络训练。 CoRR公司 abs/2002.04010(2020)
[i12]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/cor/abs-2002-04017
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2002-04017
于白,池瑾（Chi Jin）:
竞争强化学习的可证明自演算法。 CoRR公司 abs/2002.04017(2020)
[i11]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2006-2007
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2006-2007
于白,池瑾（Chi Jin）,天成余:
具有自我游戏的近最优强化学习。 CoRR公司 abs/2006.12007(2020)
[i10]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/cor/abs-2006-13436
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2006-13436
陈敏硕,于白,杰森·D·李,赵拓,Huan Wang（王欢）,熊才明,理查德·索彻:
理解分层学习：神经表征的好处。 CoRR公司 abs/2006.13436(2020)
[第九章]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2007-03760
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2007-03760
明音,于白,王玉祥:
强化学习非策略评估中的近最优可证明一致收敛性。 CoRR公司 abs/2007.03760(2020)
[i8]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2010-01604
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2010-01604
刘庆华,天成余,于白,池瑾（Chi Jin）:
对基于模型的自我游戏强化学习的深入分析。 CoRR公司 abs/2010.01604(2020)
[i7]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2010-05843
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2010-05843
于白,陈敏硕,潘舟,拓兆,杰森·D·李,沙姆·M·卡卡德,Huan Wang（王欢）,熊才明:
训练验证分割在元学习中有多重要？ CoRR公司 abs/2010.05843(2020)

2010 – 2019

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2019
[c4]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/BaiJS19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icr/BaiJS19
于白,齐家江,朱孙:
次梯度下降学习正交词典。 ICLR（海报） 2019
【c3】
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/BaiMR19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/BaiMR19
于白,马腾宇（Tengyu Ma）,安德烈·里斯特斯基:
鉴别器的近似性意味着GAN中的多样性。 ICLR（海报） 2019
【c2】
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icr/BaiWL19文件
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/BaiWL19
于白,王玉祥,Edo Liberty公司:
ProxQuant：通过邻近算子的量化神经网络。 ICLR（海报） 2019
【c1】
- 看法
- 出口记录
  dblp键：
  - conf/nips/BaiXJW19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BaiXJW19
于白,谢腾阳,南江,王玉祥:
有效的Q学习，切换成本低。 NeurIPS公司 2019:8002-8011
[i6]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1903-00184
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1903-00184
于白,约翰·杜奇,宋梅:
约束复合优化的近似算法，用于求解低秩SDP。 CoRR公司 abs/1903.00184(2019)
[i5]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1905-12849
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1905-12849
于白,谢腾阳,南江,王玉祥:
有效的Q学习，切换成本低。 CoRR公司 abs/1905.12849(2019)
[i4]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1910-01619
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1910-01619
于白,杰森·D·李:
超越线性化：关于宽神经网络的二次逼近和高阶逼近。 CoRR公司 abs/1910.01619(2019)
2018
[i3]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1806-10586
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1806-10586
于白,马腾宇（Tengyu Ma）,安德烈·里斯特斯基:
鉴别器的近似性意味着GANs中的多样性。 CoRR公司 abs/1806.10586(2018)
[i2]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1810-00861
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1810-00861
于白,王玉祥,Edo Liberty公司:
ProxQuant：通过邻近算子的量化神经网络。 CoRR公司 abs/1810.00861(2018)
[i1]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1810-10702
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1810-10702
于白,齐家江,朱孙:
次梯度下降学习正交词典。 CoRR公司 abs/1810.10702(2018)

合著者索引

请参阅常见问题解答

服务

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入才能让他们活跃起来。此处的所有设置将在您的web浏览器中存储为cookie。有关更多信息查看我们的F.A.Q。