计算机科学>机器学习
标题: 对抗性非线性约束下的在线学习
摘要: 在许多应用中,需要学习系统来处理连续的非平稳数据流。 我们在在线学习框架中研究了这一问题,并提出了一种能够处理对抗性时变和非线性约束的算法。 如我们在工作中所示,尽管可行集是缓慢时变的,且学习者事先未知,但名为约束违反速度投影(CVV-Pro)的算法实现了$\sqrt{T}$遗憾并以$1/sqrt{T}$的速度收敛到可行集。 CVV-Pro仅依赖可行集的局部稀疏线性近似,因此避免在每次迭代时对整个集进行优化,这与投影梯度或Frank-Wolfe方法形成鲜明对比。 我们还对两层博弈的算法进行了实证评估,其中参与者受到共享约束。