跳到主要内容
10.1145/3613905.3650948acm会议文章/章节视图摘要出版物页面芝加哥会议记录会议集合
正在进行的工作

为人-代理对齐进行设计:了解人类想要从他们的代理那里获得什么

出版:2024年5月11日出版历史

摘要

我们构建利用Generative AI的自主代理的能力与日俱增。作为此类代理的构建者和用户,在代理开始代表我们执行任务之前,我们不清楚需要调整哪些参数。为了发现这些参数,我们进行了一项定性实证研究,研究对象是设计能够在虚拟但相关的在线销售相机任务中进行谈判的代理。我们发现,要让代理成功执行任务,人类/用户和代理需要在6个维度上进行协调:1)知识架构协调2)自主性和代理协调3)运营协调和培训4)声誉启发协调5)道德协调和6)人的参与协调。这些经验性研究结果扩展了以往与工艺和规范一致性以及人与人工智能交互中的价值观和安全需求相关的工作。随后,我们讨论了设计师的三个设计方向,他们正在想象一个充满人-代理协作的世界。

脚注

跳过补充材料部分

补充材料

3613905.3650948-语音视频.mp4

谈话视频

英里4

4.8 MB

参考文献

  1. [未注明日期]。AutoGPT。https://github.com/Significant-Gravitas/AutoGPT。访问时间:2024-01-25。谷歌学者谷歌学者
  2. Saleema Amershi、Dan Weld、Mihaela Vorvoreanu、Adam Fourney、Besmira Nushi、Penny Collisson、Jina Suh、Shamsi Iqbal、Paul N Bennett、Kori Inkpen,2019年。人机交互指南。在2019年计算机系统人为因素会议的会议记录中。1–13.谷歌学者谷歌学者数字图书馆数字图书馆
  3. 白云涛(Yuntao Bai)、索拉夫·卡达沃斯(Saurav Kadavath)、桑迪潘·昆杜(Sandipan Kundu)、阿曼达·阿斯凯尔(Amanda Askell)、杰克逊·科尼翁(Jackson Kernion)、安迪·琼斯(Andy Jones)、安娜·陈(Anna Chen)、安纳·戈迪(。宪法ai:来自ai反馈的无害性。arXiv预打印arXiv:2212.08073(2022)。谷歌学者谷歌学者
  4. 格伦·伯曼(Glen Berman)、尼特斯·戈亚尔(Nitesh Goyal)和迈克尔·马迪奥(Michael Madaio)。2024.负责任人工智能工具评估实践的范围界定研究:有效性评估步骤。arXiv预印arXiv:2401.17486(2024)。谷歌学者谷歌学者
  5. 汤姆B。Brown、Benjamin Mann、Nick Ryder、Melanie Subbiah、Jared Kaplan、Prafulla Dhariwal、Arvind Neelakantan、Pranav Shyam、Girish Sastry、Amanda Askell、Sandhini Agarwal、Ariel Herbert Voss、Gretchen Krueger、Tom Henighan、Rewon Child、Aditya Ramesh、Daniel M。齐格勒(Ziegler)、吴杰弗里(Jeffrey Wu)、克莱门斯·温特(Clemens Winter)、克里斯托弗·黑塞(Christopher Hesse)、马克·陈(Mark Chen)、埃里克·西格勒(Eric Sigler),马特乌斯·利特温(Mateusz Litwin)、斯科特·格雷(Scott Gray)、本杰明·切斯(Benjamin Chess)。2020年。语言模型是少数射击学习者。arxiv:2005.14165[cs.CL]谷歌学者谷歌学者
  6. Kris Cao、Angeliki Lazaridou、Marc Lanctot、Joel Z Leibo、Karl Tuyls和Stephen Clark,2018年。通过谈判进行紧急沟通。arXiv预印arXiv:1804.03980(2018)。谷歌学者谷歌学者
  7. 布莱恩·克里斯蒂安。2020年,对齐问题:机器学习和人类价值。WW诺顿公司。谷歌学者谷歌学者
  8. 保罗·克里斯蒂亚诺。[未注明日期]。澄清“AI校准”。https://www.alignmentforum.org/posts/ZeE7EKHTFMBs8eMxn/clarifying-ai-alignment。访问时间:2023-08-23。谷歌学者谷歌学者
  9. 姚富、郝鹏、图沙·科特和米雷拉·拉帕塔。2023.通过自我游戏和从人工智能反馈中的上下文学习改进语言模型谈判。arXiv预打印arXiv:2305.10142(2023)。谷歌学者谷歌学者
  10. 艾森·加布里埃尔。2020年。人工智能、价值观和一致性。思维与机器30,3(2020),411-437。谷歌学者谷歌学者
  11. 尼特斯·戈亚尔(Nitesh Goyal)和苏珊·福塞尔(Susan R Fussell)。2016.感知半透明对分布式协同分析的影响。第19届ACM计算机支持的合作工作和社会计算会议论文集。288–302.谷歌学者谷歌学者数字图书馆数字图书馆
  12. 尼特斯·戈亚尔(Nitesh Goyal)和苏珊·福塞尔(Susan R Fussell)。2017.使用基于皮肤电活动的生理传感器进行智能中断管理,以实现协同感知。ACM互动、移动、可穿戴和无处不在技术会议录1,3(2017),1–21。谷歌学者谷歌学者数字图书馆数字图书馆
  13. 尼特斯·戈亚尔(Nitesh Goyal)、吉莉·莱希德(Gilly Leshed)和苏珊·福赛尔(Susan R Fussell)。2013年。视觉化和笔记对感官制作和分析的影响。在SIGCHI计算机系统人为因素会议记录中。2721–2724.谷歌学者谷歌学者数字图书馆数字图书馆
  14. 埃里克·霍维茨。1999.混合初始化用户界面原理。《SIGCHI计算机系统人为因素会议论文集》(匹兹堡,宾夕法尼亚州,美国)(CHI'99)。计算机械协会,美国纽约州纽约市,159-166。https://doi.org/10.1145/302979.303030谷歌学者谷歌学者数字图书馆数字图书馆
  15. 杰弗里·欧文(Geoffrey Irving)、保罗·克里斯蒂亚诺(Paul Christiano)和达里奥·阿莫迪(Dario Amodei)。2018.人工智能安全通过辩论。arXiv预印arXiv:1805.00899(2018)。谷歌学者谷歌学者
  16. Mike Lewis、Denis Yarats、Yann N Dauphin、Devi Parikh和Dhruv Batra。2017.成交还是不成交?谈判对话的端到端学习。arXiv预印本arXiv:1706.05125(2017)。谷歌学者谷歌学者
  17. 格洛丽亚·马克(Gloria Mark)、丹妮拉·古迪思(Daniela Gudith)和乌尔里希·克洛克(Ulrich Klocke)。2008.中断工作的代价:速度和压力更大。在SIGCHI计算机系统人为因素会议记录中。107–110.谷歌学者谷歌学者数字图书馆数字图书馆
  18. 迈克尔·诺霍维奇(Michael Noukhovitch)、特拉维斯·拉克罗瓦(Travis LaCroix)、安吉利基·拉扎里杜(Angeliki Lazaridou)和亚伦·库维尔(Aaron Courville)。2021.竞争中的紧急沟通。arXiv预印arXiv:2101.10276(2021)。谷歌学者谷歌学者
  19. 彭宝林、李春元、何鹏程、米歇尔·加利和高剑锋。2023.使用gpt-4进行指令调整。arXiv预打印arXiv:2304.03277(2023)。谷歌学者谷歌学者
  20. 萨瓦斯·彼得里迪斯(Savvas Petridis)、本·韦丁(Ben Wedin)、詹姆斯·韦克斯勒(James Wexler)、亚伦·顿斯巴赫(Aaron Donsbach)、马希玛·普什卡纳(Mahima Pushkarna)、尼特斯·戈亚尔(Nitesh Goyal)。2023.制宪者:通过将反馈转化为原则,对大型语言模型进行交互批评。arXiv预打印arXiv:2310.15428(2023)。谷歌学者谷歌学者
  21. 斯图亚特·罗素和彼得·诺维格。2009年,《人工智能:现代方法》(第三版)。美国普伦蒂斯·霍尔出版社。谷歌学者谷歌学者数字图书馆数字图书馆
  22. Alireza Sahami Shirazi、Niels Henze、Tilman Dingler、Martin Pielot、Dominik Weber和Albrecht Schmidt。2014.移动通知的大规模评估。在SIGCHI计算机系统人为因素会议记录中。3055–3064.谷歌学者谷歌学者数字图书馆数字图书馆
  23. 阿什什·夏尔马(Ashish Sharma)、苏达·拉奥(Sudha Rao)、克里斯·布罗克特(Chris Brockett)、阿坎莎·马尔霍特拉(Akanksha Malhotra)、内博伊萨·乔伊奇(Nebojsa Jojic)和比尔·多兰(。2023.在人与人的合作任务中与机构建立对话系统。arXiv预印arXiv:2305.12815(2023)。谷歌学者谷歌学者
  24. 迈克尔·特里(Michael Terry)、奇曼·库尔卡尼(Chinmay Kulkarni)、马丁·瓦滕伯格(Martin Wattenberg)、卢卡斯·迪克森(Lucas Dixon)和梅雷迪斯·林格尔·莫里斯(Meredith Ringel Morris),2023年。交互式人工智能设计中的人工智能对齐:规范对齐、过程对齐和评估支持。arXiv预打印arXiv:2311.00710(2023)。谷歌学者谷歌学者
  25. Stefan Timmermans和Iddo Tavory。2012.定性研究中的理论构建:从扎根理论到诱因分析。《社会学理论》30,3(2012年9月),167–186。https://doi.org/10.1177/0735275112457914谷歌学者谷歌学者交叉引用交叉引用
  26. 拉玛·阿迪蒂亚·瓦拉纳西(Rama Adithya Varanasi)和尼特斯·戈亚尔(Nitesh Goyal)。2023.“目前是大杂烩”:研究AI/ML从业者在共同创造负责任的AI价值观过程中面临的挑战。在2023年CHI计算机系统人为因素会议记录中。1–17.谷歌学者谷歌学者数字图书馆数字图书馆
  27. 王云龙、沈淑媛和Brian Y Lim。2023.RePrompt:自动提示编辑,使人工智能生成艺术朝着精确表达方向发展。2023年CHI计算机系统人为因素会议记录。1–29。谷歌学者谷歌学者数字图书馆数字图书馆
  28. Jason Wei、Xuezhi Wang、Dale Schuurmans、Maarten Bosma、Fei Xia、Ed Chi、Quoc V Le、Denny Zhou,2022年。思想链提示可以在大型语言模型中引发推理。神经信息处理系统进展35(2022),24824–24837。谷歌学者谷歌学者
  29. 努尔·伊尔迪里姆(Nur Yildirim)、马希玛·普什卡纳(Mahima Pushkarna)、尼特斯·戈亚尔(Nitesh Goyal)、马丁·瓦滕伯格(Martin Wattenberg)和费尔南达·维加斯。2023.调查从业者如何使用人机指南:关于人+人工智能指南的案例研究。2023年CHI计算机系统人为因素会议记录。1–13.谷歌学者谷歌学者数字图书馆数字图书馆
  30. JD Zamfirescu-Pereira、Heather Wei、Amy Xiao、Kitty Gu、Grace Jung、Matthew G Lee、Bjoern Hartmann和Qian Yang。2023.放牧人工智能猫:通过提示GPT-3设计聊天机器人的经验教训。(2023).谷歌学者谷歌学者
  31. JD Zamfirescu-Perira、Richmond Y Wong、Bjoern Hartmann和Qian Yang。2023.为什么Johnny不能提示:非人工智能专家如何尝试(但失败)设计LLM提示。2023年CHI计算机系统人为因素会议记录。1–21.谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 为人-代理对齐进行设计:了解人类想要从他们的代理那里获得什么

      建议

      评论

      登录选项

      检查您是否可以通过登录凭据或您的机构访问本文。

      登录

      完全访问权限

      • 发布于

        封面图片ACM会议
        CHI EA’24:2024年CHI计算机系统人为因素会议的扩展摘要
        2024年5月
        4761页
        国际标准图书编号:9798400703317
        内政部:10.1145/3613905年

        版权所有©2024所有者/作者

        如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的部分或全部数字或硬拷贝以供个人或课堂使用。必须尊重本作品第三方组件的版权。对于所有其他用途,请联系所有者/作者。

        出版商

        计算机协会

        美国纽约州纽约市

        出版历史

        • 出版:2024年5月11日

        检查更新

        限定符

        • 正在进行的工作
        • 研究
        • 推荐有限公司

        接受率

        总体验收率6,164属于23,696提交文件,26%

        即将召开的会议

        24岁CHI PLAY
        游戏中的计算机与人类交互年度研讨会
        2024年10月14日至17日
        坦佩雷,芬兰
      • 文章指标

        • 下载量(最近12个月)190
        • 下载次数(最近6周)190

        其他指标

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器

      全文

      以全文形式查看本文。

      查看全文

      HTML格式

      以HTML格式查看本文。

      查看HTML格式