Gergely Neu公司
人员信息
附属: 西班牙巴塞罗那DTIC庞培法布拉大学
SPARQL查询
优化列表
2020年–今天
2024 [j8] 加博尔·卢戈西 , 米哈利斯·马卡基斯 , Gergely Neu公司 :
论从被审查和非平稳需求中学习的硬度。 信息J.Optim。 6 ( 2 ) : 63-83 ( 2024 ) [公元47年] Germano Gabbianelli公司 , Gergely Neu公司 , 马泰奥·帕皮尼 , 内卡·奥科洛 :
线性MDP的离线主-对偶强化学习。 AISTATS公司 2024 : 3169-3177 [公元46年] Germano Gabbianelli公司 , Gergely Neu公司 , 马泰奥·帕皮尼 :
正确完成重要性加权的离线学习。 中高音 2024 : 614-634 [公元45年] Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 , 萨塔尔·瓦基利 :
对抗性上下文强盗变得核心化。 中高音 2024 : 907-929 [公元44年] Gergely Neu公司 , 马泰奥·帕皮尼 , 卢多维克·施瓦茨 :
乐观信息定向抽样。 柯尔特 2024 : 3970-4006 [公元43年] Gergely Neu公司 , 内卡·奥科洛 :
随机鞍点优化中无界梯度的处理。 ICML公司 2024 [i46] Gergely Neu公司 , 内卡·奥科洛 :
随机鞍点优化中无界梯度的处理。 CoRR公司 abs/2402.13903 ( 2024 ) [i45] Gergely Neu公司 , 马泰奥·帕皮尼 , 卢多维克·施瓦茨 :
乐观信息定向抽样。 CoRR公司 腹肌/2402.15411 ( 2024 ) [i44] Gergely Neu公司 , 内卡·奥科洛 :
通过功能占用梯度上升进行离线RL。 CoRR公司 abs/2405.13755 ( 2024 ) [i43] 塞尔吉奥·卡罗 , 安德斯·琼森 , Gergely Neu公司 , 卢多维克·施瓦茨 , 哈维尔·塞戈维亚·阿瓜斯 :
互模拟度量是最优运输距离,可以有效计算。 CoRR公司 abs/2406.04056 ( 2024 ) [i42] 巴普蒂斯特·阿贝莱斯 , 尤金尼奥·克莱里科 , Gergely Neu公司 :
通过延迟在线到PAC转换的混合过程的推广界限。 CoRR公司 abs/2406.12600 ( 2024 ) 2023 [公元42年] 卢卡斯·齐拉恩 , 德克·范德霍芬 , 尼科尔·塞萨·比安奇 , Gergely Neu公司 :
非随机上下文组合强盗。 AISTATS公司 2023 : 8771-8813 [公元41年] Germano Gabbianelli公司 , Gergely Neu公司 , 马泰奥·帕皮尼 :
在线学习与非政策反馈。 中高音 2023 : 620-641 [公元40年] Gergely Neu公司 , 内卡·奥科洛 :
通过随机原对偶优化在大型MDP中进行有效的全局规划。 中高音 2023 : 1101-1123 [公元39年] 安托万·穆林 , Gergely Neu公司 :
正则化动态规划的乐观规划。 ICML公司 2023 : 25337-25357 [公元38年] 朱莉娅·奥尔霍夫斯卡娅 , 杰克·梅奥 , 蒂姆·范·埃尔文 , Gergely Neu公司 , 陈玉伟 :
对抗性线性上下文强盗的一级和二级界限。 NeurIPS公司 2023 [电子2] Gergely Neu公司 , 洛伦佐·罗萨斯科 :
第三十六届学习理论年会,COLT 2023,2023年7月12-15日,印度班加罗尔。 机器学习研究进展 195, PMLR公司 2023 [目录] [i41] 安托万·穆林 , Gergely Neu公司 :
正则化动态规划的乐观规划。 CoRR公司 abs/2302.14004 ( 2023 ) [i40] 朱莉娅·奥尔霍夫斯卡娅 , 杰克·梅奥 , 蒂姆·范·埃尔文 , Gergely Neu公司 , 陈玉伟 :
对抗性线性上下文强盗的一级和二级界限。 CoRR公司 腹肌/2300500832 ( 2023 ) [i39] Germano Gabbianelli公司 , Gergely Neu公司 , 内卡·奥科洛 , 马泰奥·帕皮尼 :
线性MDP的离线主-对偶强化学习。 CoRR公司 abs/2305.12944 ( 2023 ) [i38] 加博尔·卢戈西 , Gergely Neu公司 :
在线到PAC转换:通过后悔分析的泛化界限。 CoRR公司 abs/2305.19674 ( 2023 ) [i37] Germano Gabbianelli公司 , Gergely Neu公司 , 马泰奥·帕皮尼 :
正确完成重要性加权的离线学习。 CoRR公司 abs/2309.15771 ( 2023 ) [公元36年] Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 , 萨塔尔·瓦基利 :
对抗性上下文强盗变得核心化。 CoRR公司 abs/2310.01609 ( 2023 ) 2022 [公元37年] 范璐 , Prashant G.Mehta公司 , 肖恩·梅恩 , Gergely Neu公司 :
凸Q学习的凸分析理论。 疾病预防控制中心 2022 : 4065-4071 [公元36年] 加博尔·卢戈西 , Gergely Neu公司 :
通过凸分析的推广边界。 柯尔特 2022 : 3524-3546 [公元35年] Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 , 马泰奥·帕皮尼 , 卢多维克·施瓦茨 :
提升信息比率:汤普森情境盗贼抽样的信息论分析。 NeurIPS公司 2022 [公元34年] 卢卡·维亚诺 , 安吉利基·卡莫特 , Gergely Neu公司 , 伊戈尔·克劳楚克 , 沃尔坎·切夫赫尔 :
近点模拟学习。 NeurIPS公司 2022 [i35] Gergely Neu公司 , 加博尔·卢戈西 :
通过凸分析的推广边界。 CoRR公司 abs/2202.04985 ( 2022 ) [i34] Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 , 马泰奥·帕皮尼 , 卢多维克·施瓦茨 :
提升信息比率:汤普森情境盗贼抽样的信息论分析。 CoRR公司 abs/2205.13924 ( 2022 ) [i33] Germano Gabbianelli公司 , 马泰奥·帕皮尼 , Gergely Neu公司 :
在线学习与非政策反馈。 CoRR公司 abs/2207.08956 ( 2022 ) [i32] 卢卡·维亚诺 , 安吉利基·卡莫特 , Gergely Neu公司 , 伊戈尔·克劳楚克 , 沃尔坎·切夫赫尔 :
近点模拟学习。 CoRR公司 abs/2209.10968 ( 2022 ) [i31] 范璐 , Prashant G.Mehta公司 , 肖恩·梅恩 , Gergely Neu公司 :
凸Q学习的充分探索。 CoRR公司 abs/2210.09409 ( 2022 ) [i30] Gergely Neu公司 , 内卡·奥科洛 :
通过随机原对偶优化在大型MDP中进行有效的全局规划。 CoRR公司 abs/2210.12057 ( 2022 ) 2021 [公元33年] 琼·巴斯·西洛 , 塞巴斯蒂安·居里 , 安德烈亚斯·克劳斯 , Gergely Neu公司 :
后勤Q学习。 AISTATS公司 2021 : 3610-3618 [公元32年] 范璐 , Prashant G.Mehta公司 , 肖恩·梅恩 , Gergely Neu公司 :
凸Q学习。 行政协调会 2021 : 4749-4756 [公元31年] Gergely Neu公司 :
随机梯度下降的信息论推广界。 柯尔特 2021 : 3526-3545 [公元30年] Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 :
具有线性函数近似和强盗反馈的MDP在线学习。 NeurIPS公司 2021 : 10407-10417 [i29] Gergely Neu公司 :
随机梯度下降的信息论推广界。 CoRR公司 abs/2102.00931 ( 2021 ) [第28条] 加博尔·卢戈西 , Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 :
学习从当地观察中最大化全球影响。 CoRR公司 腹肌/2109.11909 ( 2021 ) [i27] 马斯坦·阿查布 , Gergely Neu公司 :
通过分布式动态规划实现健壮性和风险管理。 CoRR公司 abs/2112.15430 ( 2021 ) 2020 [公元29年] Aryeh Kontorovich , Gergely Neu公司 :
算法学习理论2020:前言。 中高音 2020 : 1-2 [公元28年] Gergely Neu公司 , 尼基塔·日沃托夫斯基 :
弃权在线预测的快速率。 柯尔特 2020 : 3030-3048 [公元27年] Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 :
针对对抗性线性上下文盗贼的高效且健壮的算法。 柯尔特 2020 : 3049-3068 [公元26年] 琼·巴斯·西洛 , Gergely Neu公司 :
用于求解大规模马尔可夫决策过程的更快鞍点优化。 L4DC(L4DC) 2020 : 413-423 [公元25年] Gergely Neu公司 , Ciara Pike-Burke公司 :
情景强化学习中乐观主义的统一观点。 NeurIPS公司 2020 [电子1] Aryeh Kontorovich , Gergely Neu公司 :
算法学习理论,ALT 2020,2020年2月8日至11日,美国加利福尼亚州圣地亚哥。 机器学习研究进展 117, PMLR公司 2020 [目录] [i26] Gergely Neu公司 , 尼基塔·日沃托夫斯基 :
弃权在线预测的快速率。 CoRR公司 abs/2001.10623 ( 2020 ) [i25] Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 :
对抗性线性上下文盗贼的高效和稳健算法。 CoRR公司 abs/2002.00287 ( 2020 ) 【i24】 Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 :
具有线性函数近似和强盗反馈的MDP在线学习。 CoRR公司 abs/2007.01612 ( 2020 ) [第23条] Gergely Neu公司 , Ciara Pike-Burke公司 :
情景强化学习中乐观主义的统一观点。 CoRR公司 abs/2007.01891 ( 2020 ) [i22] 琼·巴斯·西洛 , 塞巴斯蒂安·居里 , 安德烈亚斯·克劳斯 , Gergely Neu公司 :
物流$Q$-学习。 CoRR公司 abs/2010.11151 ( 2020 )
2010 – 2019
2019 [j7] 弗朗西斯科·威廉米 , 克里斯蒂娜·卡诺 , Gergely Neu公司 , 鲍里斯·贝拉尔塔 , 安德斯·琼森 , 塞尔吉奥·巴拉奇纳·穆尼奥斯 :
通过自私的多臂强盗在无线网络中进行协作空间重用。 Ad Hoc网络 88 : 129-141 ( 2019 ) [j6] 弗朗西斯科·威廉米 , 塞尔吉奥·巴拉奇纳·穆尼奥斯 , 鲍里斯·贝拉尔塔 , 克里斯蒂娜·卡诺 , 安德斯·琼森 , Gergely Neu公司 :
WLAN中分散空间重用的多武器盗贼的潜力和陷阱。 J·奈特。 计算。 申请。 127 : 26-42 ( 2019 ) [公元24年] 加博尔·卢戈西 , Gergely Neu公司 , 朱莉娅·奥尔霍夫斯卡娅 :
利用局部观测实现在线影响最大化。 中高音 2019 : 557-580 [c23] 沃伊西奇·科特洛夫斯基 , Gergely Neu公司 :
Bandit主成分分析。 柯尔特 2019 : 1994-2024 [公元22年] 卡洛斯·里克尔梅 , 雨果·佩内顿斯 , 达米安·文森特 , 哈特穆特·梅内尔 , 西尔万·盖利 , 蒂莫西·曼恩 , 安德烈·巴雷托 , Gergely Neu公司 :
基于状态不确定性估计的自适应时差学习策略评估。 NeurIPS公司 2019 : 11872-11882 【c21】 妮可·穆克 , Gergely Neu公司 , 洛伦佐·罗萨斯科 :
利用尾平均和小批量处理打破SGD饱和。 NeurIPS公司 2019 : 12568-12577 【i21】 沃伊西奇·科特洛夫斯基 , Gergely Neu公司 :
Bandit主成分分析。 CoRR公司 abs/1902.03035 ( 2019 ) [i20] 妮可·穆克 , Gergely Neu公司 , 洛伦佐·罗萨斯科 :
利用尾平均和小批量处理打破SGD饱和。 CoRR公司 abs/1902.08668 ( 2019 ) [i19] 雨果·佩内顿斯 , 卡洛斯·里克尔梅 , 达米安·文森特 , 哈特穆特·梅内尔 , 蒂莫西·曼恩 , 安德烈·巴雷托 , 西尔万·盖利 , Gergely Neu公司 :
基于状态不确定性估计的自适应时差学习策略评估。 CoRR公司 abs/1906.07987 ( 2019 ) [i18] 琼·巴斯·西洛 , Gergely Neu公司 :
用于求解大规模马尔可夫决策过程的更快鞍点优化。 CoRR公司 abs/1909.10904 ( 2019 ) 2018 [公元20年] Gergely Neu公司 , 洛伦佐·罗萨斯科 :
迭代平均作为随机梯度下降的正则化。 柯尔特 2018 : 3222-3242 [第19条] 克里斯蒂娜·卡诺 , Gergely Neu公司 :
通过凸带进行无线优化:未经许可的LTE/WiFi共存。 网络AI@SIGCOMM 2018 : 41-47 [i17] 克里斯蒂娜·卡诺 , Gergely Neu公司 :
通过凸带进行无线优化:未经许可的LTE/WiFi共存。 CoRR公司 abs/1802.04327 ( 2018 ) [i16] Gergely Neu公司 , 洛伦佐·罗萨斯科 :
迭代平均作为随机梯度下降的正则化。 CoRR公司 abs/1802.08009 ( 2018 ) 【i15】 朱莉娅·奥尔霍夫斯卡娅 , Gergely Neu公司 , 加博尔·卢戈西 :
利用局部观测实现在线影响最大化。 CoRR公司 abs/1805.11022 ( 2018 ) [第14条] 弗朗西斯科·威廉米 , 塞尔吉奥·巴拉奇纳·穆尼奥斯 , 克里斯蒂娜·卡诺 , 鲍里斯·贝拉尔塔 , 安德斯·琼森 , Gergely Neu公司 :
WLAN中分散空间重用的多臂盗贼的潜力和陷阱。 CoRR公司 abs/1805.11083 ( 2018 ) 2017 [第18条] Gergely Neu公司 , 维森·戈麦斯 :
线性可解马尔可夫决策过程中在线学习的快速率。 柯尔特 2017 : 1567-1588 [第17条] 刘铜梁 , 加博尔·卢戈西 , Gergely Neu公司 , 大成涛 :
算法稳定性和假设复杂性。 ICML公司 2017 : 2159-2167 [第16条] 尼科尔·塞萨·比安奇 , 克劳迪奥·詹蒂莱 , Gergely Neu公司 , 加博尔·卢戈西 :
波尔兹曼探索做得对。 NIPS公司 2017 : 6284-6293 [i13] Gergely Neu公司 , 维森·戈麦斯 :
线性可解马尔可夫决策过程中在线学习的快速率。 CoRR公司 abs/1702.06341 ( 2017 ) [i12] 刘铜梁 , 加博尔·卢戈西 , Gergely Neu公司 , 大成涛 :
算法稳定性和假设复杂性。 CoRR公司 abs/1702.08712 ( 2017 ) [i11] Gergely Neu公司 , 安德斯·琼森 , 维森·戈麦斯 :
熵正则化马尔可夫决策过程的统一视图。 CoRR公司 abs/1705.07798 ( 2017 ) [i10] 尼科尔·塞萨·比安奇 , 克劳迪奥·詹蒂莱 , 加博尔·卢戈西 , Gergely Neu公司 :
波尔兹曼探索做得对。 CoRR公司 abs/1705.10257 ( 2017 ) [第九章] 加博尔·卢戈西 , 米哈利斯·马卡基斯 , Gergely Neu公司 :
基于截尾需求数据的库存管理难度。 CoRR公司 abs/1710.05739 ( 2017 ) [i8] 弗朗西斯科·威廉米 , 克里斯蒂娜·卡诺 , Gergely Neu公司 , 鲍里斯·贝拉尔塔 , 安德斯·琼森 , 塞尔吉奥·巴拉奇纳·穆尼奥斯 :
通过自私的多臂强盗在无线网络中进行协作空间重用。 CoRR公司 abs/1710.11403 ( 2017 ) 2016 [j5] Gergely Neu公司 , 加博尔·巴托克 :
无重要性加权的重要性加权:组合半带的一种有效算法。 J.马赫。 学习。 物件。 17 : 154:1-154:21 ( 2016 ) [第15条] Tomás Kocák , Gergely Neu公司 , 米查尔·瓦尔科 :
在线学习与噪音侧观察。 AISTATS公司 2016 : 1186-1194 [第14条] Tomás Kocák , Gergely Neu公司 , 米查尔·瓦尔科 :
使用Erdos-Renyi侧边观察图进行在线学习。 阿联酋 2016 2015 【j4】 吕克·德夫罗伊 , 加博尔·卢戈西 , Gergely Neu公司 :
在线组合优化的随机游动扰动。 IEEE传输。 Inf.理论 61 ( 7 ) : 4099-4106 ( 2015 ) [第13条] Gergely Neu公司 :
组合半强盗的一阶后悔界限。 柯尔特 2015 : 1360-1375 [第12条] Gergely Neu公司 :
无需再探索:提高非草率强盗的高概率后悔界限。 NIPS公司 2015 : 3168-3176 [i7] Gergely Neu公司 :
组合半强盗的一阶后悔界限。 CoRR公司 abs/1502.06354 ( 2015 ) [i6] Gergely Neu公司 , 加博尔·巴托克 :
无重要性权重的重要性加权:一种有效的组合半强盗算法。 CoRR公司 abs/1503.05087 ( 2015 ) [i5] Gergely Neu公司 :
不要再探索了:改进了非草率强盗的高概率后悔界限。 CoRR公司 abs/1506.03271 ( 2015 ) 2014 [j3] Gergely Neu公司 , 安德烈斯·吉尔吉 , Csaba Szepesvariá , 安德拉斯·安托斯 :
Bandit反馈下的在线马尔可夫决策过程。 IEEE传输。 自动。 控制。 59 ( 三 ) : 676-691 ( 2014 ) [注2] 安德烈斯·吉尔吉 , Gergely Neu公司 :
有限延迟通用有损信源编码的近最优速率。 IEEE传输。 Inf.理论 60 ( 5 ) : 2823-2834 ( 2014 ) [第11条] Tomás Kocák , Gergely Neu公司 , 米查尔·瓦尔科 , 雷米·穆诺斯 :
通过侧边观察对强盗问题进行内隐探索,实现高效学习。 NIPS公司 2014 : 613-621 [c10] 阿米尔·萨尼 , Gergely Neu公司 , 亚历山德罗·拉扎里奇 :
利用在线优化中的简单数据。 NIPS公司 2014 : 810-818 【c9】 Gergely Neu公司 , 米查尔·瓦尔科 :
具有随机决策集和对抗性损失的在线组合优化。 NIPS公司 2014 : 2780-2788 [i4] 亚辛·阿巴斯·亚德科里 , Gergely Neu公司 :
MDP中的在线学习和附带信息。 CoRR公司 abs/1406.6812 ( 2014 ) 2013 【b1】 Gergely Neu公司 :
在线tanulás nemstacionárius Markovöntési folyamatokban。 匈牙利布达佩斯科技经济大学, 2013 【c8】 Gergely Neu公司 , 加博尔·巴托克 :
一种有效的半带反馈学习算法。 中高音 2013 : 234-248 【c7】 吕克·德夫罗伊 , 加博尔·卢戈西 , Gergely Neu公司 :
通过随机游程扰动进行预测。 柯尔特 2013 : 460-473 【c6】 亚历山大·齐明 , Gergely Neu公司 :
基于相对熵策略搜索的情节马尔可夫决策过程在线学习。 NIPS公司 2013 : 1583-1591 [i3] 吕克·德夫罗伊 , 加博尔·卢戈西 , Gergely Neu公司 :
用随机扰动进行预测。 CoRR公司 abs/1302.5797 ( 2013 ) [i2] Gergely Neu公司 , 加博尔·巴托克 :
一种有效的半强盗反馈学习算法。 CoRR公司 腹肌/1305.2732 ( 2013 ) 2012 【c5】 Gergely Neu公司 , 安德烈斯·吉尔吉 , Csaba Szepesvariá :
转移概率未知的对抗性随机最短路径问题。 AISTATS公司 2012 : 805-813 [i1] Gergely Neu公司 , Csaba Szepesvariá :
使用反向强化学习和梯度方法的学徒学习。 CoRR公司 abs/1206.5264 ( 2012 ) 2011 【c4】 安德烈斯·吉尔吉 , Gergely Neu公司 :
有限延迟通用有损信源编码的近最优速率。 伊西特 2011 : 2218-2222 2010 【c3】 Gergely Neu公司 , 安德烈斯·吉尔吉 , Csaba Szepesvariá :
在线无环随机最短路径问题。 柯尔特 2010 : 231-243 【c2】 Gergely Neu公司 , 安德烈斯·吉尔吉 , Csaba Szepesvariá , 安德拉斯·安托斯 :
Bandit反馈下的在线马尔可夫决策过程。 NIPS公司 2010 : 1804-1812
2000 – 2009
2009 [j1] Gergely Neu公司 , Csaba Szepesvariá :
通过反向强化学习训练解析器。 机器。 学习。 77 ( 2-3 ) : 303-337 ( 2009 ) 2007 【c1】 Gergely Neu公司 , Csaba Szepesvariá :
使用反向强化学习和梯度方法的学徒学习。 阿联酋 2007 : 295-302