欢迎来到ALR-Lab
人类与机器人研究所的自主学习机器人(ALR)实验室 信息学系 ,专注于开发机器人的新型机器学习方法。 未来的机器人技术将必须处理非常具有挑战性的现实世界场景,这些场景与机器人研究中通常考虑的实验室环境截然不同。 现实世界中的环境是未知的和非结构化的,由形状不可预测的对象甚至其他未知的代理(如人类)组成。 机器人在与此类环境交互时会遇到许多不同的情况,因此对此类任务进行预先编程似乎是不可行的。
我们的研究重点是机器学习、机器人学、人机交互和计算机视觉的交叉。 我们的目标是创建数据效率高、数学原理合理的机器学习算法,适用于复杂的机器人领域,例如抓取和操作、强制交互或动态运动任务。 在我们的研究中,我们始终致力于为我们开发的基于一阶原理的算法奠定坚实的理论基础。 在方法方面,我们的工作重点是:
运动表现
强化学习和政策搜索
模仿学习与互动学习
模型学习
感知
虽然我们致力于为机器学习的每个领域扩展最新技术,但我们的愿景是创建这些方法的组合,以开发一个完全自主的学习机器人系统。
新闻:
我们搬家了!
现在你可以在 50.19号楼InformationKOM I 4楼 卡尔斯鲁厄76131。
新Neurips论文(聚焦):多时间尺度世界模型
需要一种原则性的基本形式主义来设计层次世界模型吗? 看看我们的新论文,我们在其中提出了一种概率形式主义和神经网络体系结构,用于学习多时间抽象/层次结构的世界模型。 这些轻量级潜在线性模型可以在预测方面与最先进的变压器竞争,并进一步量化不确定性。
更多
新NeurIPS论文:自适应群网格优化
用我们的新算法感受优化模拟的“刺激”, 自主感觉子午线反应 自适应群网格优化(ASMR)。 通过在网格中使用智能代理网络,我们的方法大大提高了计算速度和准确性。 ASMR提供了可扩展且高效的优化,超越了常见基线,性能与昂贵的基于错误的策略不相上下,同时运行效率更高。
更多
新NeurIPS论文:超越深度集成:分布转移下贝叶斯深度学习的大规模评估
贝叶斯深度学习(BDL)对分布移位数据提供了更好的校准预测。 我们提出了一项大规模调查,以使用WILDS收集的真实世界数据集评估现代BDL技术,强调它们在不同神经网络架构的分布变化下进行概括和校准的能力。 我们的研究包括第一个用于微调大型预处理模型的系统BDL评估,一个新的校准度量,可以区分过度自信和欠自信预测,以及一系列基于卷积和变换的神经网络。 有趣的是,集成单模近似通常会增强模型的泛化和校准。 然而,在微调大型变压器模型时会遇到挑战。 在这种情况下,“Bayes By Backprop”在准确性方面表现出色,而SWAG实现了最佳校准。
更多
新TMLR论文:高斯混合模型自然梯度变分推断的统一观点
利用高斯混合模型(GMM)的变分推理可以学习高达数百维的难处理目标分布的高度易处理的多模态近似。 目前最有效的两种基于GMM的变分推理方法VIPS和iBayes-GMM都对各个分量及其权重使用独立的自然梯度更新。 我们确定了几种设计选择,以区分这两种方法并测试所有可能的组合。 我们确定了一种新的算法选择组合,与以前的方法相比,这种组合可以产生更准确的解决方案,更新更少。
更多
新的预打印:MP3:基于运动原语的(重新)规划策略
我们介绍了一种新的深度强化学习(RL)方法,称为基于运动原语的规划策略(MP3)。 通过将动作原语(MP)集成到深度RL框架中,MP3可以在整个学习过程中生成平滑的轨迹,同时有效地学习稀疏和非马尔科夫奖励。 此外,MP3利用ProDMP的重新规划功能保持了在执行过程中适应环境变化的能力,并在竞争性基准测试任务上优于其他RL算法。
更多
RAL新论文:用于多视图6D对象姿态估计的对称感知多向融合
我们提出了一种新的6D姿势估计算法,该算法利用点云和rgb信息从多个视图推断场景中多个物体的姿势。 我们的方法是基于关键点检测器和从多个视图获得的rgb和点云数据的多向融合。 扩展了关键点检测器,也适用于对称对象。 我们的方法在几个公共基准数据集上取得了前所未有的性能。
更多
新ICLR23论文:通过准确的任务后验推理实现准确的贝叶斯元学习
神经过程(NP)是一种基于深度神经网络的BML体系结构,近年来取得了显著的成果。 之前的工作研究了一系列体系结构修改以提高性能,例如关注的计算路径或改进的上下文聚合方案,而VI方案的影响仍有待探索。 GMM-NP不需要复杂的架构修改,从而产生一个功能强大但概念简单的BML模型,在一系列具有挑战性的实验中表现优于现有技术,突出了其在数据稀缺的环境中的适用性。
更多
RSS 2022新论文:混合逆动力学模型的端到端学习
我们提出了一种残差混合逆动力学模型的新公式,该模型将完全物理一致的刚体动力学模型与递归LSTM和库仑摩擦函数相结合。 该模型使用一种名为“可微分重心”的重心参数的新公式进行端到端训练,该公式隐含地保证了物理一致性的所有条件。 在我们的实际机器人运动跟踪实验中,我们表明,新模型能够对看不见的运动实现柔顺和精确的运动跟踪。
更多
ICRA新论文:机械搜索的层次化政策学习
机械搜索(MS)是一个对象检索框架,它使用启发式算法进行推送,使用基于规则的算法进行高级规划。 虽然基于规则的政策在工作方式上得益于人类的直觉,但在许多情况下,它们通常表现为次优。 我们提出了一种深度分层强化学习(RL)算法来执行这项任务,从所需的操作次数、成功率以及计算时间来看,该算法提高了搜索性能!
更多
新CVPR 2022论文:元学习视觉回归任务的重要性?
我们设计了两种新的跨类别级视觉回归任务,即目标发现和姿势估计,这两种任务在计算机视觉元学习领域具有前所未有的复杂性,并对常用的元学习技术进行了详尽的评估,以增强泛化能力。 此外,我们提出了条件神经过程(CNPs)中任务表示的功能对比学习(FCL),并以端到端的方式进行训练。
更多
新的ICLR文件! 深度强化学习的不同信任域层
你喜欢TRPO或PPO等Deep RL方法吗? 那么你也会喜欢这个! 我们的可区分信任域层可以用于任何策略优化算法(如策略梯度)之上,以获得稳定的更新,无需近似或实现选择:)在简单勘探场景中,性能与PPO相当,而在更复杂的勘探环境中,性能优于PPO。
新的ICLR文件! 神经过程的贝叶斯上下文聚合
神经过程是概率元学习的强大工具。 然而,他们使用了相当基本的聚合方法,即使用上下文的平均聚合器,这不能给出一致的不确定性估计,并导致较差的预测性能。 使用高斯条件以贝叶斯方式进行聚合会做得更好!:)
启动@KIT
自主学习机器人(ALR)实验室于2020年1月在KIT成立。 新团队正在组建中,期待着进行激动人心的研究和教学!