22.ALT 2011:芬兰埃斯波
日尔基·基维宁 , Csaba Szepesvariá , 埃斯科·乌科宁 , 托马斯·齐格曼 :
算法学习理论第22届国际会议,ALT 2011,芬兰埃斯波,2011年10月5-7日。 诉讼程序。 计算机科学课堂讲稿 6925, 施普林格 2011 ,国际标准图书编号 978-3-642-24411-7
编辑简介
日尔基·基维宁 , Csaba Szepesvariá , 埃斯科·乌科宁 , 托马斯·齐格曼 :
编辑简介。 1-13
受邀论文
彼得·奥尔 , 小红林 , 克里斯·沃特金斯 :
强化学习中自主探索的模型(扩展摘要)。 14-17 本吉奥 , 奥利维尔·德拉略 :
论深层建筑的表现力。 18-36 乔玛·里萨南 :
最佳估计。 37 埃克·Hüllermier , 约翰内斯·富恩克兰兹(Johannes Fürnkranz) :
从标签偏好中学习。 38 李明(音) :
信息距离及其扩展。 39
归纳推理
蒂莫·科钦 :
从正数据和计数器中迭代学习。 40-54 桑杰·贾恩 , 艾瑞克·马丁 , 弗兰克·斯蒂芬 :
语言自动类的健壮学习。 55-69 桑杰·贾恩 , 艾瑞克·马丁 , 弗兰克·斯蒂芬 :
学习和分类。 70-83 迈克尔·盖尔克 , 桑德拉·齐勒斯 :
学习关系模式。 84-98
回归
塞巴斯蒂安·格奇诺维茨 , 贾元玉 :
基于▽1-球的自适应最优在线线性回归。 99-113 尼娜·瓦茨 , 科比·克拉默 :
为非静态回归重新调整权重的正则化。 114-128 阿纳克·S·达拉扬 , 约瑟夫·萨尔蒙 :
与回归中的最佳最近邻过滤器竞争。 129-143
土匪问题
塞巴斯蒂安·布贝克 , 吉尔斯·斯托尔茨 , 贾元玉 :
没有利普希茨常数的利普希兹匪徒。 144-158 安托万·所罗门 , Jean-Yves奥迪伯特 :
随机Bandit后悔的偏差。 159-173 奥雷连·加里维尔 , 埃里克·穆林斯 :
切换带宽问题的上置信限策略。 174-188 亚历山德拉·卡彭提尔 , 亚历山德罗·拉扎里奇 , 穆罕默德·加瓦姆扎德 , 雷米·穆诺斯 , 彼得·奥尔 :
多武装匪徒主动学习的上确界算法。 189-203
在线学习
君士坦丁诺·帕纳乔塔科普洛斯(Constantinos Panagiotakopoulos) , Tsampouka石油公司 :
具有动态边距的感知器。 204-218 曼弗雷德·沃穆思 , 沃特·科伦 , 大卫·P·赫尔姆博尔德 :
组合列表的初始段。 219-233 埃亚尔·戈弗 , 伊莎·曼苏尔 :
定价回溯期权的后悔最小化算法。 234-248 陆志仁(Chi-Jen Lu) , 魏福路 :
利用有限的记忆做出在线决策。 249-261 托拉蒂莫尔 , 马库斯·赫特 , 瓦比哈夫·加万 :
选定位的通用预测。 262-276 布伦丹·朱巴 , 桑托什S.万帕拉 :
简单目标的语义交流等同于在线学习。 277-291
基于核和边界的方法
张新华 , 安坎·萨哈 , S.V.N.维什瓦纳坦 :
带核Max-Margin Markov网络的加速训练。 292-307 科琳娜·科尔特斯 , Mehryar Mohri公司 :
回归中的领域适应。 308-323 Daiki Suehiro , Kohei Hatano公司 , 高本英二 :
从AUC最大化到1-范数软余量优化的近似约简。 324-337
智能代理
彼得·苏尼哈格 , 马库斯·赫特 :
理性强化学习公理。 338-352 劳伦特·奥尔索 :
通用知识搜索代理。 353-367 托拉蒂莫尔 , 马库斯·赫特 :
渐近最优代理。 368-382 托尔·拉铁摩尔 , 马库斯·赫特 :
时间一致的折扣。 383-397
其他学习模式
安娜·卡斯普齐克 , 吉中良彦 :
简单上下文无关树语法的分布学习。 398-412 埃琳娜·格里戈雷斯库 , 列夫·雷赞 , 桑托什S.万帕拉 :
稀疏奇偶校验的噪声容忍学习及其相关问题。 413-424 马尔特·达恩斯特 , 汉斯·乌里希·西蒙 , Balázs Szörényi :
监督学习和协同训练。 425-439 沙列夫·本·达维德 , 谢本·达维德 :
当标签已知时学习分类器。 440-451