埃里克·米歇尔
人员信息
其他同名人员
优化列表
2020年–今天
2024 【i24】 莫里茨·斯蒂芬 , 亚历山大·卡扎茨基 , 埃里克·米歇尔 , 安妮·S·陈 , 徐雪儿(Sheryl Hsu) , 阿奇特·夏尔马 , 切尔西-芬兰人 以下为:
RLVF:从口头反馈中学习,不要过度概括。 CoRR公司 abs/2402.10893 ( 2024 ) [第23条] 阿奇特·夏尔马 , 塞德里克·基 , 埃里克·米歇尔 , 切尔西-芬兰人 , 库沙尔·阿罗拉 , 托马斯·科勒 以下为:
用于对齐大型语言模型的人工智能反馈的关键评估。 CoRR公司 abs/2402.12366 ( 2024 ) [i22] Jihoon Tack公司 , Jaehyung Kim先生 , 埃里克·米歇尔 , 晋宇信 , 叶惠德 , 乔纳森·理查德·施瓦兹 以下为:
记忆分期上下文的语言模型在线改编。 CoRR公司 abs/2403.04317 ( 2024 ) 2023 [j1] 克拉克·W·巴雷特 , 布拉德·博伊德 , 埃利·布尔斯泰因 , 尼古拉斯·卡里尼 , 布拉德·陈 , Jihye Choi先生 , 阿姆丽塔·罗伊·乔杜里 , 米哈·克里斯托多雷斯库 , 阿努帕姆·达塔 , Soheil Feizi公司 , 凯瑟琳·费舍尔 , 桥本达素诺里 , 丹·亨德里克斯 , 萨默什·贾 , 丹尼尔·康 , 弗洛里安·克什鲍姆 , 埃里克·米歇尔 , 约翰·米切尔 , 祖勒菲卡·拉姆赞 , 卡瓦贾·沙姆斯 , 黎明之歌 , 安库尔·塔利 , 杨迪(Diyi Yang) 以下为:
识别和缓解生成性人工智能的安全风险。 已找到。 趋势Priv.Secur。 6 ( 1 ) 以下为: 1-52 ( 2023 ) [第17条] 彼得·亨德森 , 埃里克·米歇尔 , 克里斯托弗·曼宁 , 丹·尤拉夫斯基 , 切尔西-芬兰人 以下为:
自毁模型:增加基础模型有害双重使用的成本。 AIES公司 2023 以下为: 287-296年 [第16条] 内森·胡 , 埃里克·米歇尔 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
语言模型的元学习在线改编。 EMNLP公司 2023 以下为: 4418-4432 [第15条] 凯瑟琳·田 , 埃里克·米歇尔 , 艾伦·周 , 阿奇特·夏尔马 , 拉斐尔·拉斐洛夫 , 姚华秀 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
只需要求校准:从语言模型中提取校准置信度分数的策略——与人的反馈进行微调。 EMNLP公司 2023 以下为: 5433-5442 [第14条] 埃里克·米歇尔 , Yoonho Lee(李勇浩) , 亚历山大·卡扎茨基 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
DetectGPT:使用概率曲率的零镜头机器生成的文本检测。 ICML公司 2023 以下为: 24950-24962 [第13条] 陈泽明 , 盖尔·韦斯 , 埃里克·米歇尔 , 阿斯利·塞利基尔马兹 , 安托万·博塞卢特 以下为:
重新定义:通过动态知识编码进行推理。 NeurIPS公司 2023 [第12条] 拉斐尔·拉斐洛夫 , 阿奇特·夏尔马 , 埃里克·米歇尔 , 克里斯托弗·曼宁 , 斯特凡诺·埃蒙 , 切尔西-芬兰人 以下为:
直接偏好优化:你的语言模型是一个秘密的奖励模型。 NeurIPS公司 2023 【i21】 埃里克·米歇尔 , Yoonho Lee(李允浩) , 亚历山大·卡扎茨基 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
DetectGPT:使用概率曲率的零炮机器生成文本检测。 CoRR公司 腹肌/230.11305 ( 2023 ) [i20] 陈泽明 , 盖尔·韦斯 , 埃里克·米歇尔 , 阿斯利·塞利基尔马兹 , 安托万·博塞卢特 以下为:
重新定义:通过动态知识编码进行推理。 CoRR公司 abs/2305.06349 ( 2023 ) [i19] 凯瑟琳·田 , 埃里克·米歇尔 , 艾伦·周 , 阿奇特·夏尔马 , 拉斐尔·拉斐洛夫 , 姚华秀 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
只需要求校准:从语言模型中提取校准置信度分数的策略——与人的反馈进行微调。 CoRR公司 abs/2305.14975 ( 2023 ) [i18] Nathan Hu(内森·胡) , 埃里克·米歇尔 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
语言模型的元学习在线改编。 CoRR公司 abs/2305.15076 ( 2023 ) [i17] 拉斐尔·拉斐洛夫 , 阿奇特·夏尔马 , 埃里克·米歇尔 , 斯特凡诺·埃蒙 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
直接偏好优化:你的语言模型是一个秘密的奖励模型。 CoRR公司 abs/2305.18290 ( 2023 ) [i16] 克拉克·W·巴雷特 , 布拉德·博伊德 , 埃利·伯茨坦 , 尼古拉斯·卡里尼 , 布拉德·陈 , Jihye Choi先生 , 阿姆丽塔·罗伊·乔杜里 , 米哈·克里斯托多雷斯库 , 阿努帕姆·达塔 , Soheil Feizi公司 , 凯瑟琳·费舍尔 , 桥本达素诺里 , 丹·亨德里克斯 , 萨默什·贾 , 丹尼尔·康 , 弗洛里安·克什鲍姆 , 埃里克·米歇尔 , 约翰·米切尔 , 祖勒菲卡·拉姆赞 , 卡瓦贾·沙姆斯 , 黎明之歌 , 安库尔·塔利 , 杨迪(Diyi Yang) 以下为:
识别和缓解生成性人工智能的安全风险。 CoRR公司 abs/2308.14840 ( 2023 ) 【i15】 埃里克·米歇尔 , 拉斐尔·拉斐洛夫 , 阿奇特·夏尔马 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
使用小型语言模型微调大型语言模型的仿真器。 CoRR公司 abs/2310.12962 ( 2023 ) [第14条] 凯瑟琳·田 , 埃里克·米歇尔 , 姚华秀 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
针对真实性的微调语言模型。 CoRR公司 abs/2311.08401 ( 2023 ) 2022 [第11条] 埃里克·米歇尔 , 约瑟夫·诺伊 , 李思燕 , 威廉·阿姆斯特朗 , 阿南斯·阿加瓦尔 , 帕特里克·刘 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
通过自然语言推理增强预训练语言模型的自我一致性和性能。 EMNLP公司 2022 以下为: 1754-1768 [第10条] 埃里克·米歇尔 , 查尔斯·林 , 安托万·博塞卢特 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
按比例快速编辑模型。 ICLR公司 2022 【c9】 埃里克·米歇尔 , 查尔斯·林 , 安托万·博塞卢特 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
基于内存的模型按比例编辑。 ICML公司 2022 以下为: 15817-15831 [i13] 埃里克·米歇尔 , 查尔斯·林 , 安托万·博塞卢特 , 克里斯托弗·曼宁 , 切尔西-芬兰人 以下为:
基于内存的模型缩放编辑。 CoRR公司 abs/2206.06520 ( 2022 ) [i12] 埃里克·米歇尔 , 约瑟夫·诺伊 , 李思燕 , 威廉·阿姆斯特朗 , 阿南斯·阿加瓦尔 , 帕特里克·刘 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
通过自然语言推理增强预训练语言模型的自我一致性和性能。 CoRR公司 abs/2211.11875 ( 2022 ) [i11] 埃里克·米歇尔 , 彼得·亨德森 , 克里斯托弗·曼宁 , 丹·尤拉夫斯基 , 切尔西-芬兰人 以下为:
自毁模型:增加基础模型中有害双重使用的成本。 CoRR公司 abs/2211.14946 ( 2022 ) 2021 【c8】 埃里克·米歇尔 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
通过元学习获取成分归纳偏差的挑战。 AAAI的MetaDL 2021 以下为: 138-148 【c7】 王紫云 , 埃里克·米切尔 , 沃尔坎群岛 , 丹尼尔·D·李 以下为:
Geodesic-HOF:无需切角的三维重建。 AAAI公司 2021 以下为: 2844-2851 【c6】 苏拉杰·奈尔 , 埃里克·米歇尔 , 陈凯文 , 布莱恩·伊切特 , 西尔维奥·萨瓦雷斯 , 切尔西-芬兰人 以下为:
从离线数据和众源注释中学习语言条件下的机器人行为。 CoRL公司 2021 以下为: 1303-1315 【c5】 埃里克·米歇尔 , 拉斐尔·拉斐洛夫 , 薛斌鹏 , 谢尔盖·莱文 , 切尔西-芬兰人 以下为:
带优势权重的离线元强化学习。 ICML公司 2021 以下为: 7780-7791 [i10] 苏拉杰·奈尔 , 埃里克·米歇尔 , 陈凯文 , 布莱恩·伊切特 , 西尔维奥·萨瓦雷斯 , 切尔西-芬兰人 以下为:
从离线数据和众源注释学习语言条件下的机器人行为。 CoRR公司 abs/2109.01115 ( 2021 ) [第九章] 埃里克·米歇尔 , 查尔斯·林 , 安托万·博塞卢特 , 切尔西-芬兰人 , 克里斯托弗·曼宁 以下为:
按比例快速编辑模型。 CoRR公司 abs/2110.11309 ( 2021 ) 2020 【c4】 埃里克·米歇尔 , Selim发动机 , 沃尔坎群岛 , 丹尼尔·D·李 以下为:
用于学习可组合三维对象表示的高阶函数网络。 ICLR公司 2020 [c3] 塞利姆发动机 , 埃里克·米歇尔 , 大云·李 , 沃尔坎群岛 , 丹尼尔·D·李 以下为:
用于视图规划和多视图重建的高阶函数网络。 ICRA公司 2020 以下为: 11486-11492 【c2】 莱利·西蒙斯·德勒 , 本·艾斯纳 , 马尔济斯 , 安东尼·比斯尔科 , 埃里克·米歇尔 , H.Sebastian Seung先生 , 丹尼尔·D·李 以下为:
奖励预测误差作为深层RL的勘探目标。 IJCAI公司 2020 以下为: 2816-2823年 [i8] 王紫云 , 埃里克·米切尔 , 沃尔坎群岛 , 丹尼尔·D·李 以下为:
Geodesic-HOF:无需切角的三维重建。 CoRR公司 abs/2006.07981 ( 2020 ) [i7] 埃里克·米歇尔 , 拉斐尔·拉斐洛夫 , 薛斌鹏 , 谢尔盖·莱文 , 切尔西-芬兰人 以下为:
带优势权重的离线元强化学习。 CoRR公司 abs/2008.06043 ( 2020 )
2010 – 2019
2019 【c1】 塔里克·托森 , 埃里克·米歇尔 , 本·艾斯纳 , Jinwook嗯 , 博拉姆·李 , 大云·李 , 沃尔坎群岛 , H.Sebastian Seung先生 , 丹尼尔·D·李 以下为:
像素到计划:通过模仿规划师学习非预想操作。 IROS公司 2019 以下为: 第7431-7438页 [i6] 莱利·西蒙斯·德勒 , 本·艾斯纳 , 埃里克·米歇尔 , H.Sebastian Seung先生 , 丹尼尔·D·李 以下为:
跨熵策略指导下的持续行动Q-Learning。 CoRR公司 abs/1903.10605 ( 2019 ) [i5] 埃里克·米歇尔 , 斯特凡·凯塞尔吉 , 塞尔吉·波波维奇 , 达维特·布尼亚提安 , H.Sebastian Seung先生 以下为:
通过自我监督的多尺度学习实现连串编码和对齐。 CoRR公司 abs/1904.02643 ( 2019 ) [i4] 塔里克·托森 , 埃里克·米歇尔 , 本·艾斯纳 , Jinwook嗯 , 博拉姆·李 , 大云·李 , 沃尔坎群岛 , H.Sebastian Seung先生 , 丹尼尔·D·李 以下为:
像素到计划:通过模仿规划师学习非预想操作。 CoRR公司 abs/1904.03260 ( 2019 ) [i3] 莱利·西蒙斯·德勒 , 本·艾斯纳 , 埃里克·米歇尔 , H.Sebastian Seung先生 , 丹尼尔·D·李 以下为:
QXplore:通过最大化时间差异误差进行Q-学习探索。 CoRR公司 abs/1906.08189 ( 2019 ) [i2] 埃里克·米歇尔 , Kazim Selim发动机 , 沃尔坎群岛 , 丹尼尔·D·李 以下为:
用于学习可组合三维对象表示的高阶函数网络。 CoRR公司 腹肌/1907.10388 ( 2019 ) [i1] 塞利姆发动机 , 埃里克·米歇尔 , 大云·李 , 沃尔坎群岛 , 丹尼尔·D·李 以下为:
用于视图规划和多视图重建的高阶函数网络。 CoRR公司 abs/1910.02066 ( 2019 )