DJ频闪
人员信息
附属: 普林斯顿大学物理系
优化列表
![笔记](https://dblp.dagstuhl.de/img/note-mark.dark.12x12.png)
2020年–今天
2024 [i13] 亚迪亚·辛格 , DJ频闪 :
标记化计数:标记化对前沿LLM算法的影响。 CoRR公司 abs/2402.14903 ( 2024 ) 2023 【c8】 迈克尔·拉斯金 , 王璐瑜(Luyu Wang) , Junhyuk噢 , 埃米利奥·帕里索托 , 史蒂芬·斯宾塞 , Richie Steigerwald公司 , DJ频闪 , 史蒂文·斯坦伯格-汉森 , 安吉洛斯·菲洛斯 , 伊桑·A·布鲁克斯 , 马克西姆·加佐 , 希曼舒·萨尼 , 萨汀德·辛格 , 沃洛德米尔·姆尼赫 :
基于算法提取的In-context强化学习。 ICLR公司 2023 [i12] 泰德·莫斯科维茨 , 亚迪亚·辛格 , DJ频闪 , Tuomas Sandholm公司 , 鲁斯兰·萨拉库丁诺夫 , 安卡·D·德拉甘 , 斯蒂芬·麦卡勒 :
用约束RLHF对抗报酬模型过度优化。 CoRR公司 abs/2310.04373 ( 2023 ) 2022 【c7】 DJ频闪 , 凯特·鲍姆利 , 大卫·沃德·法利 , 沃洛德米尔·姆尼赫 , 史蒂文·斯坦伯格-汉森 :
通过乐观探索学习更多技能。 ICLR公司 2022 【c6】 艾莉森·塔姆 , 尼尔·C·拉比诺维茨 , 安德鲁·兰皮宁 , 尼古拉斯·A·罗伊 , 斯蒂芬妮·C.Y.·陈 , DJ频闪 , 简·王 , 安德里亚·巴尼诺 , 费利克斯·希尔 :
从语言抽象和预设表征中进行语义探索。 NeurIPS公司 2022 [i11] 艾莉森·塔姆 , 尼尔·C·拉比诺维茨 , 安德鲁·兰皮宁 , 尼古拉斯·A·罗伊 , 斯蒂芬妮·C.Y.·陈 , DJ频闪 , 简·X·王 , 安德里亚·巴尼诺 , 费利克斯·希尔 :
从语言抽象和预先训练的表征中进行语义探索。 CoRR公司 腹肌/2204.05080 ( 2022 ) [i10] 迈克尔·拉斯金 , 王璐瑜(Luyu Wang) , Junhyuk噢 , 埃米利奥·帕里索托 , 史蒂芬·斯宾塞 , Richie Steigerwald公司 , DJ频闪 , 史蒂文·汉森 , 安吉洛斯·菲洛斯 , 伊桑·A·布鲁克斯 , 马克西姆·加佐 , 希曼舒·萨尼 , 萨汀德·辛格 , 沃洛德米尔·姆尼赫 :
基于算法提取的In-context强化学习。 CoRR公司 abs/2210.14215 ( 2022 ) [第九章] 约翰·阿加皮欧 , 亚历山大·萨沙·维日涅维茨 , 埃德加·杜涅兹·古斯曼 , 贾伊德·马蒂亚斯 , 毛伊然 , 彼得·苏尼哈格 , 拉斐尔·科斯特 , 乌达里·马杜沙尼 , 卡维亚·科帕拉普 , 雷蒙娜·科马内斯库 , DJ频闪 , 迈克尔·布拉德利·约翰森 , 苏赫迪普·辛格 , 朱莉娅·哈斯 , 伊戈尔·莫达奇 , 迪恩·莫伯斯 , 乔尔·雷波 :
熔炉2.0。 CoRR公司 abs/2211.13746 ( 2022 ) 2021 【c5】 DJ频闪 , 凯文·麦基 , 马特·博特维尼克 , 爱德华·休斯 , 理查德·埃弗雷特 :
在没有人工数据的情况下与人类合作。 NeurIPS公司 2021 : 14502-14515 [i8] DJ频闪 , 凯特·鲍姆利 , 大卫·沃德·法利 , Vlad Mnih公司 , 史蒂文·汉森 :
通过乐观探索学习更多技能。 CoRR公司 abs/2107.14226 ( 2021 ) [i7] DJ频闪 , 凯文·麦基 , 马特·博特维尼克 , 爱德华·休斯 , 理查德·埃弗雷特 :
在没有人工数据的情况下与人类合作。 CoRR公司 abs/2110.08176 ( 2021 )
2010 – 2019
2019 [j3] DJ频闪 , 大卫·J·施瓦布 :
信息瓶颈和几何聚类。 神经计算。 31 ( 三 ) ( 2019 ) [注2] 吴训东 , 加布里埃尔·C·梅尔 , DJ频闪 , 巴特利特·梅尔 :
树枝状物如何影响在线识别记忆。 公共科学图书馆计算。 生物。 15 ( 5 ) ( 2019 ) 【c4】 阿尼鲁德·戈亚尔 , Riashat伊斯兰 , 丹尼尔·斯特劳斯 , 扎法拉利·艾哈迈德 , 雨果·拉罗谢尔 , 马修·博特维尼克 , 本吉奥 , 谢尔盖·莱文 :
信息机器人:通过信息瓶颈进行传输和探索。 ICLR(海报) 2019 【c3】 娜塔莎·贾克斯 , 安吉利基·拉扎里杜 , 爱德华·休斯 , 圣格雷 , 佩德罗·奥尔特加 , DJ频闪 , 乔尔·雷波 , 南多·德·弗雷塔斯 :
社会影响是多智能体深度强化学习的内在动机。 ICML公司 2019 : 3040-3049 [i6] 阿尼鲁德·戈亚尔 , Riashat伊斯兰 , 丹尼尔·斯特劳斯 , 扎法拉利·艾哈迈德 , 马修·博特维尼克 , 雨果·拉罗谢尔 , 谢尔盖·莱文 , 本吉奥 :
信息机器人:通过信息瓶颈进行传输和探索。 CoRR公司 abs/1901.10902 ( 2019 ) [i5] 安德烈亚·塔切蒂 , DJ频闪 , 玛尔塔·加内洛 , 格雷佩尔 , 约拉姆·巴赫拉赫 :
设计真实有效拍卖的神经架构。 CoRR公司 abs/1907.05181 ( 2019 ) 2018 【c2】 丹尼尔·斯特劳斯 , 马克斯·克莱曼·韦纳 , 乔什·特南鲍姆 , 马修·博特维尼克 , 大卫·J·施瓦布 :
学习使用信息规则化分享和隐藏意图。 NeurIPS公司 2018 : 10270-10281 [i4] DJ频闪 , 马克斯·克莱曼·韦纳 , 乔什·特南鲍姆 , 马修·博特维尼克 , 大卫·J·施瓦布 :
学习使用信息规则化分享和隐藏意图。 CoRR公司 abs/1808.02093 ( 2018 ) [i3] 娜塔莎·贾克斯 , 安吉利基·拉扎里杜 , 爱德华·休斯 , 圣格雷 , 佩德罗·奥尔特加 , DJ频闪 , 乔尔·雷波 , 南多·德·弗雷塔斯 :
多主体RL中通过因果影响的内在社会动机。 CoRR公司 abs/1810.08647 ( 2018 ) 2017 [j1] DJ频闪 , 大卫·J·施瓦布 :
确定性信息瓶颈。 神经计算。 29 ( 6 ) : 1611-1630 ( 2017 ) [i2] DJ频闪 , 大卫·J·施瓦布 :
信息瓶颈与几何聚类。 CoRR公司 abs/1712.09657 ( 2017 ) 2016 【c1】 DJ频闪 , 大卫·J·施瓦布 :
确定性信息瓶颈。 阿拉伯联合酋长国 2016 [i1] DJ频闪 , 大卫·J·施瓦布 :
确定性信息瓶颈。 CoRR公司 abs/1604.00268 ( 2016 )
合著者索引
![](https://dblp.dagstuhl.de/img/cog.dark.24x24.png)