正在进行的工作

为人-代理对齐进行设计：了解人类想要从他们的代理那里获得什么

作者：
尼特斯·戈亚尔

谷歌研究，美国

谷歌研究，美国

0000-0002-4666-1926
查看个人资料

,
Minsuk Chang公司

谷歌，美国

谷歌，美国

0000-0002-9441-3337
查看个人资料

,
迈克尔·特里

谷歌，美国

谷歌，美国

0000-0003-1941-939倍
查看个人资料

作者信息和声明

CHI EA’24：2024年CHI计算机系统人为因素会议的扩展摘要2024年5月文章编号：106第1-6页https://doi.org/10.1145/3613905.3650948

出版：2024年5月11日出版历史

CHI EA’24：2024年CHI计算机系统人为因素会议的扩展摘要

第1-6页

摘要

我们构建利用Generative AI的自主代理的能力与日俱增。作为此类代理的构建者和用户，在代理开始代表我们执行任务之前，我们不清楚需要调整哪些参数。为了发现这些参数，我们进行了一项定性实证研究，研究对象是设计能够在虚拟但相关的在线销售相机任务中进行谈判的代理。我们发现，要让代理成功执行任务，人类/用户和代理需要在6个维度上进行协调：1）知识架构协调2）自主性和代理协调3）运营协调和培训4）声誉启发协调5）道德协调和6）人的参与协调。这些经验性研究结果扩展了以往与工艺和规范一致性以及人与人工智能交互中的价值观和安全需求相关的工作。随后，我们讨论了设计师的三个设计方向，他们正在想象一个充满人-代理协作的世界。

脚注

补充材料

3613905.3650948-语音视频.mp4

谈话视频

英里4

4.8 MB

下载

可供下载

vtt（录像机）

3613905.3650948-语音视频.vtt（4.9 KB）

参考文献

[未注明日期]。AutoGPT。https://github.com/Significant-Gravitas/AutoGPT。访问时间：2024-01-25。谷歌学者
Saleema Amershi、Dan Weld、Mihaela Vorvoreanu、Adam Fourney、Besmira Nushi、Penny Collisson、Jina Suh、Shamsi Iqbal、Paul N Bennett、Kori Inkpen，2019年。人机交互指南。在2019年计算机系统人为因素会议的会议记录中。1–13.谷歌学者数字图书馆
白云涛（Yuntao Bai）、索拉夫·卡达沃斯（Saurav Kadavath）、桑迪潘·昆杜（Sandipan Kundu）、阿曼达·阿斯凯尔（Amanda Askell）、杰克逊·科尼翁（Jackson Kernion）、安迪·琼斯（Andy Jones）、安娜·陈（Anna Chen）、安纳·戈迪（。宪法ai：来自ai反馈的无害性。arXiv预打印arXiv:2212.08073（2022）。谷歌学者
格伦·伯曼（Glen Berman）、尼特斯·戈亚尔（Nitesh Goyal）和迈克尔·马迪奥（Michael Madaio）。2024.负责任人工智能工具评估实践的范围界定研究：有效性评估步骤。arXiv预印arXiv:2401.17486（2024）。谷歌学者
汤姆B。Brown、Benjamin Mann、Nick Ryder、Melanie Subbiah、Jared Kaplan、Prafulla Dhariwal、Arvind Neelakantan、Pranav Shyam、Girish Sastry、Amanda Askell、Sandhini Agarwal、Ariel Herbert Voss、Gretchen Krueger、Tom Henighan、Rewon Child、Aditya Ramesh、Daniel M。齐格勒（Ziegler）、吴杰弗里（Jeffrey Wu）、克莱门斯·温特（Clemens Winter）、克里斯托弗·黑塞（Christopher Hesse）、马克·陈（Mark Chen）、埃里克·西格勒（Eric Sigler），马特乌斯·利特温（Mateusz Litwin）、斯科特·格雷（Scott Gray）、本杰明·切斯（Benjamin Chess）。2020年。语言模型是少数射击学习者。arxiv:2005.14165[cs.CL]谷歌学者
Kris Cao、Angeliki Lazaridou、Marc Lanctot、Joel Z Leibo、Karl Tuyls和Stephen Clark，2018年。通过谈判进行紧急沟通。arXiv预印arXiv:1804.03980（2018）。谷歌学者
布莱恩·克里斯蒂安。2020年，对齐问题：机器学习和人类价值。WW诺顿公司。谷歌学者
保罗·克里斯蒂亚诺。[未注明日期]。澄清“AI校准”。https://www.alignmentforum.org/posts/ZeE7EKHTFMBs8eMxn/clarifying-ai-alignment。访问时间：2023-08-23。谷歌学者
姚富、郝鹏、图沙·科特和米雷拉·拉帕塔。2023.通过自我游戏和从人工智能反馈中的上下文学习改进语言模型谈判。arXiv预打印arXiv:2305.10142（2023）。谷歌学者
艾森·加布里埃尔。2020年。人工智能、价值观和一致性。思维与机器30，3（2020），411-437。谷歌学者
尼特斯·戈亚尔（Nitesh Goyal）和苏珊·福塞尔（Susan R Fussell）。2016.感知半透明对分布式协同分析的影响。第19届ACM计算机支持的合作工作和社会计算会议论文集。288–302.谷歌学者数字图书馆
尼特斯·戈亚尔（Nitesh Goyal）和苏珊·福塞尔（Susan R Fussell）。2017.使用基于皮肤电活动的生理传感器进行智能中断管理，以实现协同感知。ACM互动、移动、可穿戴和无处不在技术会议录1，3（2017），1–21。谷歌学者数字图书馆
尼特斯·戈亚尔（Nitesh Goyal）、吉莉·莱希德（Gilly Leshed）和苏珊·福赛尔（Susan R Fussell）。2013年。视觉化和笔记对感官制作和分析的影响。在SIGCHI计算机系统人为因素会议记录中。2721–2724.谷歌学者数字图书馆
埃里克·霍维茨。1999.混合初始化用户界面原理。《SIGCHI计算机系统人为因素会议论文集》（匹兹堡，宾夕法尼亚州，美国）（CHI'99）。计算机械协会，美国纽约州纽约市，159-166。https://doi.org/10.1145/302979.303030谷歌学者数字图书馆
杰弗里·欧文（Geoffrey Irving）、保罗·克里斯蒂亚诺（Paul Christiano）和达里奥·阿莫迪（Dario Amodei）。2018.人工智能安全通过辩论。arXiv预印arXiv:1805.00899（2018）。谷歌学者
Mike Lewis、Denis Yarats、Yann N Dauphin、Devi Parikh和Dhruv Batra。2017.成交还是不成交？谈判对话的端到端学习。arXiv预印本arXiv:1706.05125（2017）。谷歌学者
格洛丽亚·马克（Gloria Mark）、丹妮拉·古迪思（Daniela Gudith）和乌尔里希·克洛克（Ulrich Klocke）。2008.中断工作的代价：速度和压力更大。在SIGCHI计算机系统人为因素会议记录中。107–110.谷歌学者数字图书馆
迈克尔·诺霍维奇（Michael Noukhovitch）、特拉维斯·拉克罗瓦（Travis LaCroix）、安吉利基·拉扎里杜（Angeliki Lazaridou）和亚伦·库维尔（Aaron Courville）。2021.竞争中的紧急沟通。arXiv预印arXiv:2101.10276（2021）。谷歌学者
彭宝林、李春元、何鹏程、米歇尔·加利和高剑锋。2023.使用gpt-4进行指令调整。arXiv预打印arXiv:2304.03277（2023）。谷歌学者
萨瓦斯·彼得里迪斯（Savvas Petridis）、本·韦丁（Ben Wedin）、詹姆斯·韦克斯勒（James Wexler）、亚伦·顿斯巴赫（Aaron Donsbach）、马希玛·普什卡纳（Mahima Pushkarna）、尼特斯·戈亚尔（Nitesh Goyal）。2023.制宪者：通过将反馈转化为原则，对大型语言模型进行交互批评。arXiv预打印arXiv:2310.15428（2023）。谷歌学者
斯图亚特·罗素和彼得·诺维格。2009年，《人工智能：现代方法》（第三版）。美国普伦蒂斯·霍尔出版社。谷歌学者数字图书馆
Alireza Sahami Shirazi、Niels Henze、Tilman Dingler、Martin Pielot、Dominik Weber和Albrecht Schmidt。2014.移动通知的大规模评估。在SIGCHI计算机系统人为因素会议记录中。3055–3064.谷歌学者数字图书馆
阿什什·夏尔马（Ashish Sharma）、苏达·拉奥（Sudha Rao）、克里斯·布罗克特（Chris Brockett）、阿坎莎·马尔霍特拉（Akanksha Malhotra）、内博伊萨·乔伊奇（Nebojsa Jojic）和比尔·多兰（。2023.在人与人的合作任务中与机构建立对话系统。arXiv预印arXiv:2305.12815（2023）。谷歌学者
迈克尔·特里（Michael Terry）、奇曼·库尔卡尼（Chinmay Kulkarni）、马丁·瓦滕伯格（Martin Wattenberg）、卢卡斯·迪克森（Lucas Dixon）和梅雷迪斯·林格尔·莫里斯（Meredith Ringel Morris），2023年。交互式人工智能设计中的人工智能对齐：规范对齐、过程对齐和评估支持。arXiv预打印arXiv:2311.00710（2023）。谷歌学者
Stefan Timmermans和Iddo Tavory。2012.定性研究中的理论构建：从扎根理论到诱因分析。《社会学理论》30，3（2012年9月），167–186。https://doi.org/10.1177/0735275112457914谷歌学者交叉引用
拉玛·阿迪蒂亚·瓦拉纳西（Rama Adithya Varanasi）和尼特斯·戈亚尔（Nitesh Goyal）。2023.“目前是大杂烩”：研究AI/ML从业者在共同创造负责任的AI价值观过程中面临的挑战。在2023年CHI计算机系统人为因素会议记录中。1–17.谷歌学者数字图书馆
王云龙、沈淑媛和Brian Y Lim。2023.RePrompt:自动提示编辑，使人工智能生成艺术朝着精确表达方向发展。2023年CHI计算机系统人为因素会议记录。1–29。谷歌学者数字图书馆
Jason Wei、Xuezhi Wang、Dale Schuurmans、Maarten Bosma、Fei Xia、Ed Chi、Quoc V Le、Denny Zhou，2022年。思想链提示可以在大型语言模型中引发推理。神经信息处理系统进展35（2022），24824–24837。谷歌学者
努尔·伊尔迪里姆（Nur Yildirim）、马希玛·普什卡纳（Mahima Pushkarna）、尼特斯·戈亚尔（Nitesh Goyal）、马丁·瓦滕伯格（Martin Wattenberg）和费尔南达·维加斯。2023.调查从业者如何使用人机指南：关于人+人工智能指南的案例研究。2023年CHI计算机系统人为因素会议记录。1–13.谷歌学者数字图书馆
JD Zamfirescu-Pereira、Heather Wei、Amy Xiao、Kitty Gu、Grace Jung、Matthew G Lee、Bjoern Hartmann和Qian Yang。2023.放牧人工智能猫：通过提示GPT-3设计聊天机器人的经验教训。(2023).谷歌学者
JD Zamfirescu-Perira、Richmond Y Wong、Bjoern Hartmann和Qian Yang。2023.为什么Johnny不能提示：非人工智能专家如何尝试（但失败）设计LLM提示。2023年CHI计算机系统人为因素会议记录。1–21.谷歌学者数字图书馆

索引术语

为人-代理对齐进行设计：了解人类想要从他们的代理那里获得什么
1. 计算方法
  1. 人工智能
    1. 人工智能的哲学/理论基础
2. 以人为中心的计算
  1. 协作和社交计算

建议

生殖代理人：人类行为的交互式模拟
UIST’23：第36届ACM用户界面软件和技术年度研讨会会议记录

人类行为的可信代理可以支持交互式应用程序，从沉浸式环境到用于人际交流的排练空间，再到原型工具。本文介绍了生成代理：计算软件。。。
阅读更多信息
代理人的人类直接性
K-CAP’01：第一届知识获取国际会议记录

代理技术的许多潜在应用都需要人和代理协同工作才能有效地完成复杂的任务。相比之下，迄今为止，代理界的大部分工作都集中于实现完全自主的技术。。。
阅读更多信息
中止BDI代理中的任务
AAMAS’07：第六届自治代理和多代理系统国际联合会议记录

打算在动态环境中工作的智能代理必须能够优雅地处理不成功的任务和计划。此外，这些代理人应该能够就适当的行动方案作出合理的决定，这可能。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
CHI EA’24：2024年CHI计算机系统人为因素会议的扩展摘要
2024年5月
4761页
国际标准图书编号：9798400703317
内政部：10.1145/3613905年
编辑：
弗洛里安·弗洛伊德·米勒
莫纳什大学
,
佩尼·基伯兹
澳大利亚国立大学
,
朱莉·威廉姆森
格拉斯哥大学
,
科里纳
兰卡斯特大学
版权所有©2024所有者/作者
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的部分或全部数字或硬拷贝以供个人或课堂使用。必须尊重本作品第三方组件的版权。对于所有其他用途，请联系所有者/作者。
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2024年5月11日
检查更新
作者标记
代理人
生成性人工智能
人机对齐
人-代理对齐
大型语言模型
限定符
- 正在进行的工作
- 研究
- 推荐有限公司
会议

接受率
总体验收率6,164属于23,696提交文件，26%
即将召开的会议
24岁CHI PLAY

赞助商：

西奇

游戏中的计算机与人类交互年度研讨会

2024年10月14日至17日

坦佩雷，芬兰
资金来源
其他指标
查看文章指标

文章指标
- 0
  引文总数
  查看引文
- 190
  总下载次数
- 下载量（最近12个月）190
- 下载次数（最近6周）190
其他指标
查看作者指标
引用人
本出版物尚未被引用

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

全文

以全文形式查看本文。

查看全文

HTML格式

以HTML格式查看本文。

查看HTML格式

为人-代理对齐进行设计：了解人类想要从他们的代理那里获得什么

CHI EA’24：2024年CHI计算机系统人为因素会议的扩展摘要

摘要

脚注

补充材料

可供下载

参考文献

引用人

索引术语

建议

生殖代理人：人类行为的交互式模拟

代理人的人类直接性

中止BDI代理中的任务

评论