[编辑]

第199卷:终身学习代理会议,2022年8月22日至24日,加拿大魁北克省蒙特利尔市麦吉尔大学

[编辑]

编辑:Sarath Chandar、Razvan Pascanu、Doina Precup

[围兜][城市规划署]

基于能量的持续学习模型

双莉、杜益伦、吉多·范德文、伊戈尔·莫达奇;第一届终身学习代理会议记录,PMLR 199:1-22

任务环境如何影响MAML性能?

利亚姆·柯林斯(Liam Collins)、雅利安·莫赫塔里(Aryan Mokhtari)、桑杰·沙科塔伊(Sanjay Shakkottai);第一届终身学习代理会议记录,下午:199:23-59

基于基础模型的持续学习:潜在重播的实证研究

Oleksiy Ostapenko、Timothee Lesort、Pau Rodriguez、Md Rifat Arefin、Arthur Douillard、Irina Rish、Laurent Charlin;第一届终身学习代理会议记录,PMLR 199:60-91

EFL:非ID数据的弹性联合学习

马自晨、于璐、李文业、崔曙光;第一届终身学习代理会议记录,PMLR 199:92-115

相关位移下的解纠缠和泛化

Christina M.Funke、Paul Vicol、Kuan-chie Wang、Matthias Kuemmerer、Richard Zemel、Matthia Bethge;第一届终身学习代理会议记录,PMLR 199:116-141

学习型优化器中记忆、计算和性能之间的实际权衡

卢克·梅茨,C。Daniel Freeman、James Harrison、Niru Maheswaranathan、Jascha Sohl-dickstein;第一届终身学习代理会议记录,PMLR 199:142-164

论宏观上的随时学习

Lucas Caccia、Jing Xu、Myle Ott、Marcaurelio Ranzato、Ludovic Denoyer;第一届终身学习代理会议记录,下午:199:165-182

基于连续无监督学习的深网络光流估计

西蒙·马鲁洛、马特奥·蒂埃齐、亚历山德罗·贝蒂、拉波·法吉、恩里科·梅洛尼、斯特凡诺·梅拉奇;第一届终身学习代理会议记录,PMLR 199:183-200

通过哈密尔顿方程进行连续学习

亚历山德罗·贝蒂(Alessandro Betti)、拉波·法吉(Lapo Faggi)、马可·戈里(Marco Gori;第一届终身学习代理会议记录,PMLR 199:201-2012年

基于激活的早期中止改进元学习泛化

Simon Guiroy、Christopher Pal、Goncalo Mordido、Sarath Chandar;第一届终身学习代理会议记录,PMLR 199:213-230

基于规则的盾牌:从灾难性行动效应中积累安全规则

Shahaf S.Shperberg、Bo Liu、Alessandro Allievi、Peter Stone;第一届终身学习代理会议记录,PMLR 199:231-242

持续学习与私人释放

刘波、刘强、彼得·斯通;第一届终身学习代理会议记录,PMLR 199:243-254

克服利用GAN进行少量数据增强的挑战

克里斯托弗·贝克汉姆、伊萨姆·拉拉吉、保罗·罗德里格斯、大卫·巴斯克斯、德里克·诺鲁泽扎莱、克里斯托弗·帕尔;第一届终身学习代理会议记录,PMLR 199:255-280

提高无监督可视域自适应的模型泛化能力

穆罕默德·罗斯塔米;第一届终身学习代理会议记录,PMLR 199:281-293

机器人非政策数据终身学习中的遗忘与失衡

周文轩(Wenxuan Zhou)、史蒂文·博赫兹(Steven Bohez)、扬·亨普利克(Jan Humplik)、尼古拉斯·海斯(Nicolas Heess)、阿巴斯·阿卜杜勒马利基(Abbas Abdolmaleki)、杜尚恩·拉奥(Dushyant Rao)、马库斯·;第一届终身学习代理会议记录,PMLR 199:294-309

无限非静态聚类的流推理

Rylan Schaeffer、Gabrielle Kaili-may Liu、Yilun Du、Scott Linderman、Ila R.Fiete;第一届终身学习代理会议记录,PMLR 199:310-326

缺乏经验的RL代理无法正确处理:有限样本复杂性后悔的下限

Maia Fraser、Vincent Létourneau;第一届终身学习代理会议记录,PMLR 199:327-334

竞争联合水库计算动态系统的连续学习

Leonard Bereska,Efstratios Gavves;第一届终身学习代理会议记录,PMLR 199:335-350

用图神经网络学习以对象为中心的自主行为

艾哈迈德·阿克齐亚(Ahmed Akakzia)、奥利维尔·西高德(Olivier Sigaud);第一届终身学习代理会议记录,PMLR 199:351-365

TAG:基于任务的终身学习累积梯度

Pranshu Malviya、Balaraman Ravindran、Sarath Chandar;第一届终身学习代理会议记录,199:366-389下午

任务不可知表征整合:一种基于自我监督的连续学习方法

Prashant Shivaram Bhat、Bahram Zonooz、Elahe Arani;第一届终身学习代理大会论文集,PMLR 199:390-405

强化学习的Zipfian环境

Stephanie C.Y.Chan、Andrew Kyle Lampinen、Pierre Harvey Richemond、Felix Hill;第一届终身学习代理会议记录,PMLR 199:406-429

CLActive:快速主动学习的情景记忆

斯里·奥罗宾多·穆纳加拉(Sri Aurobindo Munagala)、西德汉特·苏布拉曼尼亚(Sidhant Subramanian)、什亚姆戈帕尔·卡提克(Shyamgopal Karthik)、阿米亚·帕布(Ameya Prabhu)、阿诺普·南布迪里(Anoop Namboodiri);第一届终身学习代理会议记录,PMLR 199:430-440

应对终身强化学习中非平稳性的反应性探索

克里斯蒂安·亚历山大·斯坦帕兹(Christian Alexander Steinparz)、托马斯·施密德(Thomas Schmied)、费比安·佩舍尔(Fabian Paischer)、马吕斯·康斯坦丁·迪努(Marius-constantin Dinu)、维亨·普拉卡什·帕蒂尔(Vihang Prakash Patil)、安吉拉·比特恩姆;第一届终身学习代理会议记录,PMLR 199:441-469

离线强化学习的数据集视角

卡杰坦·施威格霍夫、马吕斯·康斯坦丁·迪努、安德烈亚斯·拉德勒、马库斯·霍夫马彻、维亨·普拉卡什·帕蒂尔、安吉拉·比特恩姆林、哈米德·埃格巴勒·扎德、塞普·霍克莱特;第一届终身学习代理会议记录,PMLR 199:470-517

预测学习使神经网络能够学习复杂的工作记忆任务

Thijs Lambik Van der Plas、Sanjay G.Manohar、Tim P.Vogels;第一届终身学习代理会议记录,下午:199:518-531

深层油藏计算中的基准学习效率

雨果·西斯内罗斯、托马斯·米科洛夫、约瑟夫·西维奇;第一届终身学习代理会议记录,PMLR 199:532-547

通过分发外重播实现连续学习的多头部模型

Gyuhak Kim、Bing Liu、Zixuan Ke;第一届终身学习代理会议记录,PMLR 199:548-563

论恶意软件分类的持续学习局限性

穆罕默德·赛杜尔·拉赫曼、斯科特·库尔、马修·赖特;第一届终身学习代理会议记录,PMLR 199:564-582

多任务公平陈述的内在局限性

Tosca Lechner、Shai Ben David;第一届终身学习代理会议记录,PMLR 199:583-603

我应该知道什么?使用元梯度下降在单一经验流中进行预测特征发现

Alex Kearney、Anna Koop、Johannes Günther、Patrick M.Pilarski;第一届终身学习代理会议记录,PMLR 199:604-616

神经激活零空间中连续学习的稀疏性和异质性辍学

Ali Abbasi、Parsa Nooraline Nejad、Vladimir Braverman、Hamed Pirsiavash、Soheil Kolouri;第一届终身学习代理会议记录,PMLR 199:617-628

神经网络中训练样本密度的测试样本精度标度

Xu Ji,Razvan Pascanu,R。德文·赫杰姆(Devon Hjelm)、巴拉吉·拉克什米纳拉亚南(Balaji Lakshminarayanan)、安德烈亚·维达尔迪(Andrea Vedaldi);第一届终身学习代理会议记录,PMLR 199:629-646

持续学习中的知识转移理论

戴安娜·贝纳维德斯·普拉多,帕特里夏·里德尔;第一届终身学习代理会议记录,PMLR 199:647-660

用于动力学泛化的仿真获得的潜在动作空间

尼古拉斯·科拉多(Nicholas Corrado)、瞿玉霄(Yuxiao Qu)、乔西亚·汉纳(Josiah P.Hanna);第一届终身学习代理会议记录,PMLR 199:661-682

用于连续强化学习的自激活神经集成

Sam Powers、Eliot Xing、Abhinav Gupta;第一届终身学习代理会议记录,PMLR 199:683-704

CORA:作为持续强化学习代理平台的基准、基线和指标

Sam Powers、Eliot Xing、Eric Kolve、Roozbeh Mottaghi、Abhinav Gupta;第一届终身学习代理会议记录,PMLR 199:705-743

嵌入式设备的在线持续学习

Tyler L.Hayes,Christopher Kanan;第一届终身学习代理会议记录,PMLR 199:744-766

Heat-RL:流时间序列异常检测的在线模型选择

王玉晶、熊洛欣、张明良、薛慧、陈琦、杨亚明、童云海、黄从瑞、徐碧雄;第一届终身学习代理大会论文集,PMLR 199:767-777

终身DP:终身机器学习中的一致有界差异隐私

Phung Lai、Han Hu、Hai Phan、Ruoming Jin、My Thai、An Chen;第一届终身学习代理会议记录,PMLR 199:778-797

神经提取是强化学习中的状态表示瓶颈

瓦伦汀·吉列特、丹尼斯·乔治·威尔逊、艾曼纽尔·拉切尔森;第一届终身学习代理会议记录,PMLR 199:798-818

二次正则化器如何防止灾难性遗忘:插值的作用

Ekdeep Singh Lubana、Puja Trivedi、Danai Koutra、Robert Dick;第一届终身学习代理会议记录,PMLR 199:819-837

通过保留经验进行终身机器人强化学习

谢安妮(Annie Xie),切尔西(Chelsea Finn);第一届终身学习代理会议记录,PMLR 199:838-855

强化学习中技能转移的分层启动

Michael Matthews、Mikayel Samvelyan、Jack Parker-holder、Edward Grefenstette、Tim Rocktäschel;第一届终身学习代理会议记录,PMLR 199:856-874

基于增强相似性学习的开放集识别

Sepideh Esmaeilpour、Lei Shu、Bing Liu;第一届终身学习代理大会论文集,PMLR 199:875-885

非稳态环境中的超梯度

Jelena Luketina、Sebastian Flennerhag、Yannick Schroecker、David Abel、Tom Zahavy、Satinder Singh;第一届终身学习代理会议记录,PMLR 199:886-901

MO2:基于模型的脱机选项

萨沙·索尔特(Sasha Salter)、马库斯·沃尔夫迈耶(Markus Wulfmeier)、德鲁瓦·蒂鲁马拉(Dhruva Tirumala)、尼古拉·海斯(Nicolas Heess)、马丁·里德米勒(Martin Riedmiller)、雷亚·哈德塞尔(Raia Hadsell;第一届终身学习代理会议记录,PMLR 199:902-919

一般持续学习中新息巩固与经验回放的协同

Fahad Sarfraz、Elahe Arani、Bahram Zonooz;第一届终身学习代理会议记录,PMLR 199:920-936

使用表示相似性引导的多任务特征共享来抑制任务干扰

Naresh Kumar Gurulingan、Elahe Arani、Bahram Zonooz;第一届终身学习代理会议记录,第199页第937-951页

基于差分的场景变化检测自监督预训练

Vijaya Raghavan T.Ramkumar、Elahe Arani、Bahram Zonooz;第一届终身学习代理会议记录,PMLR 199:952-965

最优传输满足噪声标签鲁棒损失和域自适应混合正则化

基利安·法特拉斯、Hiroki Naganuma、Ioannis Mitliagkas;第一届终身学习代理会议记录,PMLR 199:966-981

CompoSuite:作文强化学习基准

豪尔赫·门德斯(Jorge A.Mendez)、马塞尔·胡辛(Marcel Hussing)、梅格纳·古马迪(Meghna Gummadi)、埃里克·伊顿(Eric Eaton);第一届终身学习代理会议记录,PMLR 199:982-1003

连续新颖性检测

Rahaf Aljundi、Daniel Olmeda Reino、Nikolay Chumerin、Richard E.Turner;第一届终身学习代理会议记录,PMLR 199:1004-1025

InBiaseD:通过形状感知提高泛化性和稳健性的归纳偏差提取

Shruthi Gowda、Bahram Zonooz、Elahe Arani;第一届终身学习代理会议记录,PMLR 199:1026-1042

梯度空间中基于降维的少镜头学习

马丁·高奇(Martin Gauch)、马克西米利安·贝克(Maximilian Beck)、托马斯·阿德勒(Thomas Adler)、德米特罗·科特尔(Dmytro Kotsur)、斯特凡·菲尔(Stefan Fiel)、哈米德·埃格巴勒·扎德(Hamid Eghbal-zadeh)、约翰内斯·布兰德斯泰特(Johannes Brandstetter)、约翰尼斯·科夫勒(Johannes Kofl;第一届终身学习代理会议记录,PMLR 199:1043-1064

SHELS:用于新颖性检测和无类边界连续学习的独有特征集

梅格纳·古马迪(Meghna Gummadi)、大卫·肯特(David Kent)、豪尔赫·门德斯(Jorge A.Mendez)、埃里克·伊顿(Eric Eaton);第一届终身学习代理会议记录,PMLR 199:1065-1085

CNN体系结构的可信度评估与可信软件设计

Mingxi Cheng、Tingyang Sun、Shahin Nazarian、Paul Bogdan;第一届终身学习代理会议记录,PMLR 199:1086-1102

调整预训练语言模型以简化低资源文本:路径至关重要

Cristina Garbacea、乔竹梅;第一届终身学习代理大会论文集,PMLR 199:1103-1119

终身强化学习的无模型生成回放:在星际争霸2中的应用

Zachary Alan Daniels、Aswin Raghavan、Jesse Hostetler、Abrar Rahman、Indranil Sur、Michael Piacentino、Ajay Divakaran、Roberto Corizzo、Kamil Faber、Nathalie Japkowicz、Michael Baron、James Smith、Sahana Pramod Joshi、Zsolt Kira、Cameron Ethan Taylor、Mustafa Burak Gurbuz、Constantine Dovrolis、Tyler L.Hayes、Christopher Kanan,贾伊尔·加拉多;第一届终身学习代理会议记录,PMLR 199:1120-1145

改进的在线模拟学习策略优化

乔纳森·威尔德·拉文顿、莎兰·瓦斯瓦尼、马克·施密特;第一届终身学习代理会议记录,PMLR 199:1146-1173

价值相关特征中的学习技能多样化

Matthew J.A.Smith、Jelena Luketina、Kristian Hartikainen、Maximilian Igl、Shimon Whiteson;第一届终身学习代理会议记录,PMLR 199:1174-1194

一致性是进一步缓解持续学习中灾难性遗忘的关键

Prashant Shivaram Bhat、Bahram Zonooz、Elahe Arani;第一届终身学习代理会议记录,PMLR 199:1195-1212

人工辅助歧义解决视觉基础的模拟-真实转换

乔治·齐亚法斯(Georgios Tziafas)、兰伯特·斯科马克(Lambert Schomaker)、哈米德雷扎·卡萨伊(Hamidreza Kasaei);第一届终身学习代理会议记录,PMLR 199:1213-1230

无任务工程的深度强化学习中的迁移探究

Andrei Alex Rusu、Sebastian Flennerhag、Dushyant Rao、Razvan Pascanu、Raia Hadsell;第一届终身学习代理会议记录,PMLR 199:1231-1254

订阅通过RSS