计算机科学>人机交互
职务: 交互式人工智能设计中的人工智能对齐:规范对齐、过程对齐和评估支持
摘要: 人工智能校准考虑了确保人工智能产生预期结果而没有不良副作用的总体问题。 虽然通常从安全和人类价值的角度考虑,但在设计和评估交互式人工智能系统的接口时,也可以考虑人工智能对齐。 本文将人工智能校准的概念映射到一个基本的三步交互循环中,从而产生一组相应的校准目标:1)规范校准:确保用户能够高效可靠地将目标传达给人工智能, 2)过程对齐:提供验证和可选控制人工智能执行过程的能力,以及3)评估支持:确保用户能够验证和理解人工智能的输出。 我们还介绍了代理过程的概念,定义为人工智能实际过程的简化、单独推导但可控的表示; 以及过程海湾的概念,它强调了人类和人工智能过程之间的差异如何会导致人工智能控制的挑战。 为了说明该框架的价值,我们沿着三个对齐维度中的每一个描述了商业和研究系统,并展示了提供交互式对齐机制的接口如何能够带来质的不同和改进的用户体验。