刘哲伦(Evan Zheran Liu)
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [第11条] 谢安妮(Annie Xie) , 洛根·M·巴米迪帕特 , 刘哲伦(Evan Zheran Liu) , 乔伊·洪 , 谢尔盖·莱文 , 切尔西-芬兰人 :
学习利用信息奖励在POMDP中进行探索。 ICML公司 2024 [第10条] 刘哲伦(Evan Zheran Liu) , 大卫·袁 , 艾哈迈德·艾哈迈德 , 爱丽舍·康沃尔 , 朱丽叶·伍德罗 , 凯莉·伯恩斯 , 阿伦·聂 , 艾玛·布伦斯基 , 克里斯·皮奇 , 切尔西-芬兰人 :
用于突破任务的快速准确机器学习自动分级机。 SIGCSE(一) 2024 : 736-742 [i13] 李香丽莎 , 刘哲伦(Evan Zheran Liu) , 珀西·梁 , 桥本达素诺里 :
AutoBencher:为语言模型创建突出、新颖、困难的数据集。 CoRR公司 abs/2407.08351 ( 2024 ) 2023 【c9】 刘哲伦(Evan Zheran Liu) , 萨哈纳·苏里 , 童木 , 艾伦·周 , 切尔西-芬兰人 :
作为元强化学习副产品的简单体现语言学习。 ICML公司 2023 : 21997-22008 [i12] 雅各布·贝克 , 里斯托·武里奥 , 刘哲伦(Evan Zheran Liu) , 郑雄 , 路易斯·辛特格拉夫 , 切尔西-芬兰人 , 西蒙·怀特森 :
元强化学习调查。 CoRR公司 abs/2301.08028 ( 2023 ) [i11] 刘哲伦(Evan Zheran Liu) , 萨哈纳·萨里 , 童木 , 艾伦·周 , 切尔西-芬兰人 :
作为元强化学习副产品的简单体现语言学习。 CoRR公司 abs/2306.08400 ( 2023 ) 2022 【c8】 江一丁 , 刘哲伦(Evan Zheran Liu) , 本杰明·艾森巴赫 , J.Zico Kolter公司 , 切尔西-芬兰人 :
通过压缩学习选项。 NeurIPS公司 2022 【c7】 刘哲伦(Evan Zheran Liu) , 莫里茨·斯蒂芬 , 阿伦·聂 , 克里斯·皮奇 , 艾玛·布伦斯基 , 切尔西-芬兰人 :
通过元探索对交互式学生项目给予反馈。 NeurIPS公司 2022 [i10] Evan Zheran Liu(刘哲然) , 莫里茨·斯蒂芬 , 阿伦·聂 , 克里斯·皮奇 , 艾玛·布伦斯基 , 切尔西-芬兰人 :
通过元探索对交互式学生项目给予反馈。 CoRR公司 abs/2211.08802 ( 2022 ) [第九章] 江一丁 , 刘哲伦(Evan Zheran Liu) , 本杰明·艾森巴赫 , 齐科·科尔特 , 切尔西-芬兰人 :
通过压缩学习选项。 CoRR公司 abs/2212.04590 ( 2022 ) 2021 【c6】 刘哲伦(Evan Zheran Liu) , 贝扎德·哈古 , 安妮·S·陈 , 阿迪蒂·拉古纳坦 , 庞伟高 , 佐川贤治 , 珀西·梁 , 切尔西-芬兰人 :
只需训练两次:在不训练组信息的情况下提高组的健壮性。 ICML公司 2021 : 6781-6792 [c5] 刘哲伦(Evan Zheran Liu) , 阿迪蒂·拉古纳坦 , 珀西·梁 , 切尔西-芬兰人 :
解耦探索与开发,实现无牺牲的元强化学习。 ICML公司 2021 : 6925-6935 [i8] 刘哲伦(Evan Zheran Liu) , 贝扎德·哈古 , 安妮·S·陈 , 阿迪蒂·拉古纳坦 , 庞伟高 , 佐川贤治 , 珀西·梁 , 切尔西-芬兰人 :
只需训练两次:在不训练组信息的情况下提高组的健壮性。 CoRR公司 abs/2107.09044 ( 2021 ) [i7] 利昂·西特 , 刘哲伦(Evan Zheran Liu) , 玛丽·佩拉特 , 詹姆斯·韦克斯勒 , 米拉德·哈希米 , Been Kim(金) , 马丁·马斯 :
分析缓存模型。 CoRR公司 abs/2112.06989 ( 2021 ) 2020 【c4】 Evan Zheran Liu(刘哲然) , 米拉德·哈希米 , 凯文·斯沃斯基 , 帕塔萨拉西·兰加纳坦 , 安俊华 :
缓存替换的模拟学习方法。 ICML公司 2020 : 6237-6247 [i6] 刘哲伦(Evan Zheran Liu) , 米拉德·哈希米 , 凯文·斯沃斯基 , 帕塔萨拉西·兰加纳坦 , 安俊华 :
缓存替换的模拟学习方法。 CoRR公司 abs/2006.16239 ( 2020 ) [i5] 刘哲伦(Evan Zheran Liu) , 拉丁·克拉马蒂 , 苏达珊·塞沙德里 , 开尔文·古 , Panupong Pasupat公司 , 艾玛·布伦斯基 , 珀西·梁 :
学习战略探索和快速回报转移的抽象模型。 CoRR公司 abs/2007.05896 ( 2020 ) [i4] 刘哲伦(Evan Zheran Liu) , 阿迪蒂·拉古纳坦 , 珀西·梁 , 切尔西-芬兰人 :
探索然后执行:通过因子化元强化学习在没有回报的情况下适应。 CoRR公司 腹肌/2008.02790 ( 2020 )
2010 – 2019
2018 【c3】 Panupong Pasupat公司 , 田顺江 , 刘哲伦(Evan Zheran Liu) , 开尔文·古 , 珀西·梁 :
将自然语言命令映射到web元素。 EMNLP公司 2018 : 4970-4976 【c2】 刘哲伦(Evan Zheran Liu) , 开尔文·古 , Panupong Pasupat公司 , 田林石 , 珀西·梁 :
使用工作流引导的探索在Web界面上强化学习。 ICLR(海报) 2018 [i3] 刘哲伦(Evan Zheran Liu) , 开尔文·古 , Panupong Pasupat公司 , 田林石 , 珀西·梁 :
使用工作流引导的探索在Web界面上强化学习。 CoRR公司 abs/1802.08802 ( 2018 ) [i2] 帕努蓬县 , 田顺江 , 刘哲伦(Evan Zheran Liu) , 开尔文·古 , 珀西·梁 :
将自然语言命令映射到Web元素。 CoRR公司 abs/1808.09132 ( 2018 ) 2017 【c1】 开尔文·古 , Panupong Pasupat公司 , 刘哲伦(Evan Zheran Liu) , 珀西·梁 :
从语言到程序:衔接强化学习和最大边际可能性。 ACL(1) 2017 : 1051-1062 [i1] 开尔文·古 , Panupong Pasupat公司 , 刘哲伦(Evan Zheran Liu) , 珀西·梁 :
从语言到程序:衔接强化学习和最大边际可能性。 CoRR公司 abs/1704.07926 ( 2017 )