张晓燕
优化列表
![笔记](https://dblp.org/img/note-mark.dark.12x12.png)
2020年–今天
2024 【j4】 阿迪蒂亚·莫汉 , 张晓燕 , 马吕斯·林道尔 :
深度强化学习中的结构:调查和开放问题。 J.阿蒂夫。 智力。 物件。 79 : 1167-1236 ( 2024 ) [第11条] 保罗·巴德 , 雅各布·福斯特 , 德里克·诺鲁泽扎莱 , 张晓燕 :
离线多智能体强化学习协调问题的一种基于模型的解决方案。 美国原子能机构 2024 : 141-150 [i20] 泰勒·英格布兰德 , 张晓燕 , Ufuk Topcu公司 :
通过功能编码器进行零炮强化学习。 CoRR公司 abs/2401.17173 ( 2024 ) [i19] 紫韩鼎 , 张晓燕 , 田远东 , 郑庆庆 :
扩散世界模型。 CoRR公司 abs/2402.03570 ( 2024 ) [i18] 亚历山大·莱文 , 斯通 , 张晓燕 :
多步反向并不是您所需要的全部。 CoRR公司 腹肌/24031940 ( 2024 ) [i17] 卡勒布·查克 , 卡尔·齐 , 迈克尔·蒙杰 , 李硕泽 , 马克斯·鲁道夫 , 长石 , 西德汉·阿加瓦尔 , 哈拉希·西科奇 , 阿比纳夫·佩里 , 萨塔克·达亚尔 , Evan Kuo先生 , 卡万·梅塔 , 安东尼王 , 斯通 , 张晓燕 , 斯科特·尼库姆 :
机器人空中曲棍球:一种用于机器人强化学习的操纵试验台。 CoRR公司 abs/2405.03113 ( 2024 ) 2023 [j3] 罗伯特·柯克 , 张晓燕 , 爱德华·格雷芬斯特特 , 蒂姆·罗克塔舍尔 :
深度强化学习中零炮概括的调查。 J.阿蒂夫。 智力。 物件。 76 : 201-264 ( 2023 ) [第10条] 穆龙洛 , 熊文杰 , Geunbae Lee公司 , 李月英 , 杨晓萌 , 张晓燕 , 田远东 , 李显新 , G.爱德华·苏 :
AutoCAT:用于自动探索缓存计时攻击的强化学习。 HPCA公司 2023 : 317-332 【c9】 王同洲 , 安东尼奥·托拉尔巴 , 菲利普·伊索拉 , 张晓燕 :
通过准度量学习实现最优目标的强化学习。 ICML公司 2023 : 36411-36430 【c8】 西德汉·阿加瓦尔 , 伊珊·杜鲁加尔 , 斯通 , 张晓燕 :
f-Policy Gradients:使用f-Divergences的目标条件RL的通用框架。 NeurIPS公司 2023 【c7】 朱汉林 , 张晓燕 :
具有一般函数逼近和单策略集中性的高效离线目标条件强化学习。 NeurIPS公司 2023 [i16] 朱汉林 , 张晓燕 :
具有一般函数逼近和单策略集中性的高效离线目标条件强化学习。 CoRR公司 abs/2302.03770 ( 2023 ) 【i15】 郑巧杰 , 张久才 , 张晓燕 , 张晓丽 :
置信软件3D凝视估计和评估度量。 CoRR公司 abs/2303.10062 ( 2023 ) [第14条] 通州王 , 安东尼奥·托拉尔巴 , 菲利普·伊索拉 , 张晓燕 :
通过准度量学习实现最优目标的强化学习。 CoRR公司 abs/2304.01203 ( 2023 ) [i13] 保罗·巴德 , 雅各布·福斯特 , 德里克·诺鲁泽扎莱 , 张晓燕 :
离线多智能体强化学习协调问题的一种基于模型的解决方案。 CoRR公司 abs/2305.17198 ( 2023 ) [i12] 朱洁 , 蒙沙湖 , 梁雪尧 , 张晓燕 , 金若明 , 刘瑞(Rui Liu) :
公平敏感策略-梯度强化学习,用于减少机器人协助中的偏差。 CoRR公司 腹肌/2306.04167 ( 2023 ) [i11] 阿努杰·马哈扬 , 张晓燕 :
强化学习中观察变化的泛化。 CoRR公司 腹肌/2306.04595 ( 2023 ) [i10] 阿迪蒂亚·莫汉 , 张晓燕 , 马吕斯·林道尔 :
强化学习的结构:一项调查和开放性问题。 CoRR公司 abs/2306.16021 ( 2023 ) [第九章] 西德汉·阿加瓦尔 , 伊珊·杜鲁加尔 , 斯通 , 张晓燕 :
f-Policy Gradients:使用f-Divergences的目标条件RL的一般框架。 CoRR公司 abs/2310.06794 ( 2023 ) [i8] 瑞阳(Rui Yang) , 韩忠 , 徐嘉伟 , 张晓燕 , 张崇杰 , 雷寒 , 张彤(音译) :
在多种数据腐败情况下实现稳健的离线强化学习。 CoRR公司 abs/2310.12955 ( 2023 ) [i7] 罗斯坦德·费泽 , 蒂莫西·萨洛 , 张晓燕 , 张志立 :
剖析物联网设备供应流程。 CoRR公司 abs/2310.14125 ( 2023 ) [i6] 布雷特·巴克利 , 张晓燕 , 大卫·弗里多维奇-基尔 :
强化学习中时间反转对称性的研究。 CoRR公司 abs/2311.17008 ( 2023 ) 2022 【c6】 张晓燕 , 亚伦·布鲁克豪斯 , 丹尼尔·哈默 , 弗朗西丝卡·斯佩萨诺 , 莉亚娜·巴宾科斯托娃 :
预测虚假和真实新闻传播者的影响(学生摘要)。 AAAI公司 2022 : 13107-13108 [c5] 通州王 , 西蒙·S·杜 , 安东尼奥·托拉尔巴 , 菲利普·伊索拉 , 张晓燕 , 田远东 :
去噪MDP:学习世界模型比学习世界本身更好。 ICML公司 2022 : 22591-22612 [i5] 通州王 , 西蒙·S·杜 , 安东尼奥·托拉尔巴 , 菲利普·伊索拉 , 张晓燕 , 田远东 :
去噪MDPs:学习世界模型胜过世界本身。 CoRR公司 abs/2206.15477 ( 2022 ) [i4] 穆龙洛 , 熊文杰 , Geunbae Lee公司 , 李月英 , 杨晓萌 , 张晓燕 , 田远东 , 李显新 , G.爱德华·苏 :
AutoCAT:用于自动探索缓存定时通道攻击的强化学习。 CoRR公司 abs/2208.08025 ( 2022 ) [i3] 埃德温·张 , 卢玉杰 , 威廉·王 , 张晓燕 :
LAD:强化学习的语言强化扩散。 CoRR公司 abs/2210.15629 ( 2022 ) [i2] 克里斯·伦格里奇 , 加布里埃尔·辛纳维 , 张晓燕 , 休皮革 , 库尔特·舒斯特 , 弗朗索瓦·沙顿 , 查尔斯·雷德伍德 :
对比蒸馏是一种用于转移学习的样本有效的自我监督损失策略。 CoRR公司 abs/2212.11353 ( 2022 ) 2021 [i1] 罗伯特·柯克 , 张晓燕 , 爱德华·格雷芬斯特特 , 蒂姆·罗克塔舍尔 :
深度强化学习中的泛化调查。 CoRR公司 abs/2111.09794 ( 2021 )
2010 – 2019
2019 [注2] Deena M.A.Gendoo公司 , 罗伯特·登罗奇 , 张晓燕 , 尼古拉·拉杜洛维奇 , Gun Ho Jang先生 , 马修·莱米尔 , 桑德拉·菲舍尔 , 戴安娜·查德威克 , 伊琳卡·M·伦古 , 埃明·伊布拉希莫夫 , 平江曹 , 林肯·D·斯坦 , 朱莉·M·威尔逊 , 约翰·M·S·巴特利特 , 曹明声 , 尼沙·达尼 , 大卫·赫德利 , 史蒂文·加林格 , 本杰明·海贝-凯恩斯 :
全基因组定义了胰腺癌原发、异种移植和器官样模型匹配的一致性。 公共科学图书馆计算。 生物。 15 ( 1 ) ( 2019 ) 2018 [j1] 阿米莉亚·贝特曼 , 奥利弗·K·赵 , 安德烈亚·巴伊西 , 马修·詹宁斯 , 布莱恩·N·托斯 , 亚历克莎·科恩 , 艾米莉·霍顿 , 阿尼什·卡塔尔 , Ryan S.Kuo先生 , 费利克斯·A·李 , 梅林·K·林 , 劳拉·米加修克 , 兰克什·伦加纳坦 , 张晓燕 , 马西奥·奥利维拉 :
以用户为中心,为视觉障碍学生设计和分析静电触觉触摸屏系统。 国际期刊休谟计算。 螺柱。 109 : 102-111 ( 2018 ) 2013 【c4】 Adithya Renduchintala公司 , 张晓燕 , 托马斯·波尔津 , 吉兰·萨瓦迪 :
使用机器学习和HL7 LOINC DO对临床文档进行分类。 AMIA公司 2013 【c3】 朱海一 , 张晓燕 , 何继平 , 罗伯特·E·克劳特 , 动漫猫 :
同龄人反馈对贡献的影响:维基百科上的一个实地实验。 芝加哥 2013 : 2253-2262 2010 【c2】 张晓燕 , 莫妮卡迪拉 :
知识传播与工程教学。 ICLS(1) 2010 : 1087-1094
2000 – 2009
合著者索引
![](https://dblp.org/img/cog.dark.24x24.png)