摘要
补充材料
可供下载
[未注明日期]。 AutoGPT。 https://github.com/Significant-Gravitas/AutoGPT。 访问时间:2024-01-25。 谷歌学者 Saleema Amershi、Dan Weld、Mihaela Vorvoreanu、Adam Fourney、Besmira Nushi、Penny Collisson、Jina Suh、Shamsi Iqbal、Paul N Bennett、Kori Inkpen,2019年。 人机交互指南。 在2019年计算机系统人为因素会议的会议记录中。 1–13. 谷歌学者 数字图书馆 白云涛(Yuntao Bai)、索拉夫·卡达沃斯(Saurav Kadavath)、桑迪潘·昆杜(Sandipan Kundu)、阿曼达·阿斯凯尔(Amanda Askell)、杰克逊·科尼翁(Jackson Kernion)、安迪·琼斯(Andy Jones)、安娜·陈(Anna Chen)、安纳·戈迪(。 宪法ai:来自ai反馈的无害性。 arXiv预打印arXiv:2212.08073(2022)。 谷歌学者 格伦·伯曼(Glen Berman)、尼特斯·戈亚尔(Nitesh Goyal)和迈克尔·马迪奥(Michael Madaio)。 2024.负责任人工智能工具评估实践的范围界定研究:有效性评估步骤。 arXiv预印arXiv:2401.17486(2024)。 谷歌学者 汤姆B。 Brown、Benjamin Mann、Nick Ryder、Melanie Subbiah、Jared Kaplan、Prafulla Dhariwal、Arvind Neelakantan、Pranav Shyam、Girish Sastry、Amanda Askell、Sandhini Agarwal、Ariel Herbert Voss、Gretchen Krueger、Tom Henighan、Rewon Child、Aditya Ramesh、Daniel M。 齐格勒(Ziegler)、吴杰弗里(Jeffrey Wu)、克莱门斯·温特(Clemens Winter)、克里斯托弗·黑塞(Christopher Hesse)、马克·陈(Mark Chen)、埃里克·西格勒(Eric Sigler),马特乌斯·利特温(Mateusz Litwin)、斯科特·格雷(Scott Gray)、本杰明·切斯(Benjamin Chess)。 2020年。语言模型是少数射击学习者。 arxiv:2005.14165[cs.CL] 谷歌学者 Kris Cao、Angeliki Lazaridou、Marc Lanctot、Joel Z Leibo、Karl Tuyls和Stephen Clark,2018年。 通过谈判进行紧急沟通。 arXiv预印arXiv:1804.03980(2018)。 谷歌学者 布莱恩·克里斯蒂安。 2020年,对齐问题:机器学习和人类价值。 WW诺顿公司。 谷歌学者 保罗·克里斯蒂亚诺。 [未注明日期]。 澄清“AI校准”。 https://www.alignmentforum.org/posts/ZeE7EKHTFMBs8eMxn/clarifying-ai-alignment。 访问时间:2023-08-23。 谷歌学者 姚富、郝鹏、图沙·科特和米雷拉·拉帕塔。 2023.通过自我游戏和从人工智能反馈中的上下文学习改进语言模型谈判。 arXiv预打印arXiv:2305.10142(2023)。 谷歌学者 艾森·加布里埃尔。 2020年。人工智能、价值观和一致性。 思维与机器30,3(2020),411-437。 谷歌学者 尼特斯·戈亚尔(Nitesh Goyal)和苏珊·福塞尔(Susan R Fussell)。 2016.感知半透明对分布式协同分析的影响。 第19届ACM计算机支持的合作工作和社会计算会议论文集。 288–302. 谷歌学者 数字图书馆 尼特斯·戈亚尔(Nitesh Goyal)和苏珊·福塞尔(Susan R Fussell)。 2017.使用基于皮肤电活动的生理传感器进行智能中断管理,以实现协同感知。 ACM互动、移动、可穿戴和无处不在技术会议录1,3(2017),1–21。 谷歌学者 数字图书馆 尼特斯·戈亚尔(Nitesh Goyal)、吉莉·莱希德(Gilly Leshed)和苏珊·福赛尔(Susan R Fussell)。 2013年。视觉化和笔记对感官制作和分析的影响。 在SIGCHI计算机系统人为因素会议记录中。 2721–2724. 谷歌学者 数字图书馆 埃里克·霍维茨。 1999.混合初始化用户界面原理。 《SIGCHI计算机系统人为因素会议论文集》(匹兹堡,宾夕法尼亚州,美国)(CHI'99)。 计算机械协会,美国纽约州纽约市,159-166。 https://doi.org/10.1145/302979.303030 谷歌学者 数字图书馆 杰弗里·欧文(Geoffrey Irving)、保罗·克里斯蒂亚诺(Paul Christiano)和达里奥·阿莫迪(Dario Amodei)。 2018.人工智能安全通过辩论。 arXiv预印arXiv:1805.00899(2018)。 谷歌学者 Mike Lewis、Denis Yarats、Yann N Dauphin、Devi Parikh和Dhruv Batra。 2017.成交还是不成交? 谈判对话的端到端学习。 arXiv预印本arXiv:1706.05125(2017)。 谷歌学者 格洛丽亚·马克(Gloria Mark)、丹妮拉·古迪思(Daniela Gudith)和乌尔里希·克洛克(Ulrich Klocke)。 2008.中断工作的代价:速度和压力更大。 在SIGCHI计算机系统人为因素会议记录中。 107–110. 谷歌学者 数字图书馆 迈克尔·诺霍维奇(Michael Noukhovitch)、特拉维斯·拉克罗瓦(Travis LaCroix)、安吉利基·拉扎里杜(Angeliki Lazaridou)和亚伦·库维尔(Aaron Courville)。 2021.竞争中的紧急沟通。 arXiv预印arXiv:2101.10276(2021)。 谷歌学者 彭宝林、李春元、何鹏程、米歇尔·加利和高剑锋。 2023.使用gpt-4进行指令调整。 arXiv预打印arXiv:2304.03277(2023)。 谷歌学者 萨瓦斯·彼得里迪斯(Savvas Petridis)、本·韦丁(Ben Wedin)、詹姆斯·韦克斯勒(James Wexler)、亚伦·顿斯巴赫(Aaron Donsbach)、马希玛·普什卡纳(Mahima Pushkarna)、尼特斯·戈亚尔(Nitesh Goyal)。 2023.制宪者:通过将反馈转化为原则,对大型语言模型进行交互批评。 arXiv预打印arXiv:2310.15428(2023)。 谷歌学者 斯图亚特·罗素和彼得·诺维格。 2009年,《人工智能:现代方法》(第三版)。 美国普伦蒂斯·霍尔出版社。 谷歌学者 数字图书馆 Alireza Sahami Shirazi、Niels Henze、Tilman Dingler、Martin Pielot、Dominik Weber和Albrecht Schmidt。 2014.移动通知的大规模评估。 在SIGCHI计算机系统人为因素会议记录中。 3055–3064. 谷歌学者 数字图书馆 阿什什·夏尔马(Ashish Sharma)、苏达·拉奥(Sudha Rao)、克里斯·布罗克特(Chris Brockett)、阿坎莎·马尔霍特拉(Akanksha Malhotra)、内博伊萨·乔伊奇(Nebojsa Jojic)和比尔·多兰(。 2023.在人与人的合作任务中与机构建立对话系统。 arXiv预印arXiv:2305.12815(2023)。 谷歌学者 迈克尔·特里(Michael Terry)、奇曼·库尔卡尼(Chinmay Kulkarni)、马丁·瓦滕伯格(Martin Wattenberg)、卢卡斯·迪克森(Lucas Dixon)和梅雷迪斯·林格尔·莫里斯(Meredith Ringel Morris),2023年。 交互式人工智能设计中的人工智能对齐:规范对齐、过程对齐和评估支持。 arXiv预打印arXiv:2311.00710(2023)。 谷歌学者 Stefan Timmermans和Iddo Tavory。 2012.定性研究中的理论构建:从扎根理论到诱因分析。 《社会学理论》30,3(2012年9月),167–186。 https://doi.org/10.1177/0735275112457914 谷歌学者 交叉引用 拉玛·阿迪蒂亚·瓦拉纳西(Rama Adithya Varanasi)和尼特斯·戈亚尔(Nitesh Goyal)。 2023.“目前是大杂烩”:研究AI/ML从业者在共同创造负责任的AI价值观过程中面临的挑战。 在2023年CHI计算机系统人为因素会议记录中。 1–17. 谷歌学者 数字图书馆 王云龙、沈淑媛和Brian Y Lim。 2023.RePrompt:自动提示编辑,使人工智能生成艺术朝着精确表达方向发展。 2023年CHI计算机系统人为因素会议记录。 1–29。 谷歌学者 数字图书馆 Jason Wei、Xuezhi Wang、Dale Schuurmans、Maarten Bosma、Fei Xia、Ed Chi、Quoc V Le、Denny Zhou,2022年。 思想链提示可以在大型语言模型中引发推理。 神经信息处理系统进展35(2022),24824–24837。 谷歌学者 努尔·伊尔迪里姆(Nur Yildirim)、马希玛·普什卡纳(Mahima Pushkarna)、尼特斯·戈亚尔(Nitesh Goyal)、马丁·瓦滕伯格(Martin Wattenberg)和费尔南达·维加斯。 2023.调查从业者如何使用人机指南:关于人+人工智能指南的案例研究。 2023年CHI计算机系统人为因素会议记录。 1–13. 谷歌学者 数字图书馆 JD Zamfirescu-Pereira、Heather Wei、Amy Xiao、Kitty Gu、Grace Jung、Matthew G Lee、Bjoern Hartmann和Qian Yang。 2023.放牧人工智能猫:通过提示GPT-3设计聊天机器人的经验教训。 (2023). 谷歌学者 JD Zamfirescu-Perira、Richmond Y Wong、Bjoern Hartmann和Qian Yang。 2023.为什么Johnny不能提示:非人工智能专家如何尝试(但失败)设计LLM提示。 2023年CHI计算机系统人为因素会议记录。 1–21. 谷歌学者 数字图书馆
索引术语
为人-代理对齐进行设计:了解人类想要从他们的代理那里获得什么
建议
生殖代理人:人类行为的交互式模拟 UIST’23:第36届ACM用户界面软件和技术年度研讨会会议记录 人类行为的可信代理可以支持交互式应用程序,从沉浸式环境到用于人际交流的排练空间,再到原型工具。 本文介绍了生成代理:计算软件。。。 中止BDI代理中的任务 AAMAS’07:第六届自治代理和多代理系统国际联合会议记录 打算在动态环境中工作的智能代理必须能够优雅地处理不成功的任务和计划。 此外,这些代理人应该能够就适当的行动方案作出合理的决定,这可能。。。