韩国大田市韩国高级科学技术学院的Alice Oh教授站在一栋大楼外的肖像。

AI“面向所有人”:获取新模型如何推动学术研究,从天文学到教育

2023年初,韩国高级科学技术研究院(KAIST)的Alice Oh教授和她的同事意识到,他们需要解决KAIST学生对OpenAI ChatGPT快速增长的兴趣。

他们认为,ChatGPT是OpenAI开发的一种工具,可以在大型语言模型上运行,并根据人们的提示生成对话响应,这可能会导致学生在工作中走捷径,但也可能提供教育益处。该小组想开发一个研究项目,让学生参与使用这项技术,所以他们开始考虑如何开发自己的聊天应用程序。 

“我们当时很匆忙,”KAIST计算机学院的教授Oh说。“我们的学期从三月份开始,我们希望学生们在学期开始时就开始使用它。”

这是一张女教授与两名坐在电脑前的女学生在韩国高级科学技术学院演讲厅交谈的照片。
KAIST的英语教授So-Yeon Ahn指导学生测试一个平台,该平台旨在帮助英语作为外语的学生撰写论文。由Jean Chung为微软拍摄。
 

很快出现了一个解决方案。2023年4月,微软研究院(Microsoft Research)启动了一项计划,旨在加快基础模型的开发和使用。基础模型是根据大量数据训练的大型人工智能模型,可用于广泛的任务。

推进基础模型研究(AFMR公司)通过以下方式为学术研究人员提供最先进的基础模型Azure AI服务其目标是培养全球人工智能研究社区,并提供强大、可信的模型,帮助从科学发现和教育到医疗、多元文化赋权、法律工作和设计等学科的进一步研究。

该倡议的赠款计划包括15个国家的200个大学项目,涉及广泛的重点领域。波士顿东北大学的研究人员正在开发一种人工智能助手,旨在表现出对员工幸福感的同情。在越南胡志明市科技大学,研究人员计划创建一个专门针对越南语的微调大型语言模型(LLM)。在加拿大,蒙特利尔大学的研究人员正在探索LLM如何帮助分子设计和新药的发现。

访问基础模型对学术研究人员来说是一项挑战,他们必须等待共享资源的使用,因为共享资源可能缺乏运行大型模型所需的计算能力。微软研究院(Microsoft Research)发起了一项倡议,为研究人员提供了一系列强大的基础通过Azure提供的模型确保人工智能的发展不仅受到行业的推动,还受到学术研究界的推动。

微软研究院Research Research Catalyst高级主管Evelyne Viegas表示:“我们意识到,为了开发当今的人工智能,行业确实需要为学术界开放能力。”。“这些不同的观点可能会影响我们正在做的事情。”

可以访问Azure OpenAI服务它将OpenAI的尖端模型与Azure中提供的安全、隐私和负责任的AI保护相结合,Oh和KAIST团队开发了一个平台,该平台使用聊天机器人ChatGPT的底层模型来帮助大学生为英语作为外语(EFL)课程写文章。Oh说,学生们经常在晚上写作,因为教授或助教没有指导,而EFL学生经常使用工具来帮助他们应对用英语写作的挑战。

电脑屏幕的特写照片,显示了韩国高级科学技术研究所的研究人员开发的聊天机器人界面。
KAIST平台是通过微软资助项目开发的,该项目为学者提供高级人工智能模型的访问权限,旨在允许聊天机器人只回答学生的问题,而不为他们撰写论文。由Jean Chung为微软拍摄。
 

Oh的团队设计了聊天机器人来回答学生的问题,但不是为他们写文章。在一个学期内,213名EFL学生使用该工具改进了他们的论文;该平台收集了学生们根据聊天机器人的回答提出的问题和修改的论文,然后Oh的团队分析了数据并发布了纸张关于实验。

研究人员发现,一些学生广泛使用该平台,并将其提供的反馈纳入其中。Oh说,许多人将聊天机器人视为“智能同龄人”,这表明该技术可以对课堂教学起到有益的补充作用。由于该平台使用GPT-4,这是一种由OpenAI开发的大型多模式模型,可以用多种语言进行交流,学生在使用该平台时有时会在英语和母语之间切换,从而实现更自然的互动。

KAIST团队计划将该平台扩展到创意写作和会话英语课程。Oh看到了教育中生成性人工智能的巨大潜力,特别是如果可以训练模型来告诉学生如何通过问题进行推理,而不是简单地提供答案。

她说:“大学应该充分利用这一点,真正开始思考如何将这些工具用于科学研究和教育。”。

“就像有一个超级顾问”

北卡罗来纳州农业技术州立大学的研究人员获得了微软项目的资助,他们正在开发一种基于人工智能的交通监控系统,能够识别道路拥堵和安全隐患。该项目旨在实现传统交通监控系统所需的大部分手动工作的自动化。

研究人员使用GPT-4和其他人工智能模型,这些模型依赖于联邦政府收集的交通数据来分析交通模式和拥堵。用户通过聊天机器人与系统交互,可以询问有关当前交通状况的问题,例如特定位置的交通繁忙程度或车辆行驶速度。

“这将使交通管理更容易、更高效,”从事该项目的博士生特沃德罗斯·格布雷(Tewodros Gebre)表示。

该系统使用GPT-4来解释从传感器、无人机和GPS收集的交通数据,允许交通机构、城市规划师和不一定是数据科学家的公民通过聊天应用程序快速获取交通状况信息。

该大学地理空间和遥感副教授Leila Hashemi-Beni表示:“我们讨论数据公平性,这种与chatbot的结合使人们可以使用该系统,而无需进入这个复杂的模型,看看发生了什么。”。“具有不同技能的人仍然可以从这个系统中获得他们需要的信息。”

她说,该系统仍在开发中,可以帮助确定自然灾害后的最佳疏散路线。

“这不仅仅是交通。这个项目有更大、更广泛的影响。它为我们提供了进行尖端研究的机会,这对我们作为研究人员和教育工作者非常有帮助。”

一组六名年轻人围坐在教室里的一张桌子旁,桌上放着电脑和黑板。
左二的Ioana Ciucé是澳大利亚国立大学的一名研究员,正在组织一项利用人工智能推进天文学研究的活动。照片由陈伯泉提供。

哈佛大学和澳大利亚国立大学的天文学家正在以不同的方式利用GPT-4。为了利用LLM加速天文学研究,该组织称为“宇宙TBD”,开发了一个基于astronomy的聊天应用程序这来自于30多万篇天文学论文。

哈佛大学应用天文学教授罗伯特·惠勒·威尔逊(Robert Wheeler Wilson)表示,该应用程序最终可以帮助年轻天文学家从学术论文中提取关键信息,并分析数据,以发展自己的研究和理论。

古德曼说:“如果你有一个真正好的想法,很难只搜索文献并试图找到所有东西。”。“这有点像有一位超级顾问,一位才华横溢的天文学家,他有着百科全书般的记忆力,他可以说,‘好吧,这可能是一个很好的主意,原因如下’,或者‘这可能是个坏主意,原因如此’。”

澳大利亚国立大学(The Australian National University)的朱比利(Jubilee)联合研究员、欧洲航天局(European Space Agency)数据科学家桑德·克鲁克(Sandor Kruk)和卡雷克·伊耶(Kartheik Iyer)表示,研究人员希望开发出更小的天文学语言模型,让各级天文学家都能使用,哥伦比亚大学NASA哈勃研究员。

她说:“我们的使命是让科学为每个人民主化。”。“GPT-4是一个非常大的语言模型,它运行在大量资源上。在我们追求民主化访问的过程中,我们希望构建更小的模型,学习GPT-4,也可以学习比GPT-4更好的天文学语言。这就是我们的设想。”

AFMR的许多研究项目侧重于利用LLM实现一系列社会效益,从利用生成性人工智能评估大流行风险,到利用视觉和语言模型帮助失明或视力低下的人在户外导航。

牛津大学(University of Oxford)的研究人员正在研究如何通过扩大告知LLM的人类反馈,使LLM更加多样化。研究人员审查了95篇学术论文发现传统上,用于定制和评估LLM输出的人的反馈来自于不一定代表较大人口的小群体。研究人员Hannah Rose Kirk表示,因此,LLM会根据“最终使用这些模型的人群中极少数人的偏好和价值观”进行定制

例如,这可能意味着,如果你要求一位语言模特帮你策划婚礼,你很可能会得到一些关于西方传统婚礼的信息,比如大白裙、玫瑰等(这一发现是2021年研究).

柯克说:“想象一下,一个模型可以从个人或社会文化背景中学习更多,并将其帮助调整为帮助你计划婚礼,或者至少知道婚礼对不同的人来说看起来不同——它应该提出一个后续问题,以确定该走哪条路。”,牛津大学研究法学硕士的博士生。

对于他们的AFMR项目Kirk和牛津大学副教授、牛津互联网研究所高级研究员Scott Hale对来自75个国家的1500人进行了调查,了解他们使用语言模型的频率,以及这些生成性人工智能模型的哪些特征——比如反映他们的价值观或实事求是——对他们来说很重要。研究参与者随后与各种生成性人工智能模型进行了一系列实时对话,并对其输出进行了评级。

借助Azure功能,Kirk和Hale将利用来自世界各地参与者的反馈和对话来训练和微调语言模型,使其更加多样化。他们计划将他们的数据集提供给其他研究人员,并希望这项工作将鼓励更具包容性的语言模型。

黑尔说:“人们不想觉得这项技术是为别人而不是为我设计的。”。“就某人可以从中获得的效用而言,如果他们可以将其作为会话代理来推理某事或做出决定、查找某事或访问内容,那么这种利益应该在整个社会中平均分配。”

他说:“在设计生成性人工智能模型时,有更多的人参与,更多的观点最终会带来更好的技术,它会带来提升每个人的技术。”。

“全球变化的催化剂”

维加斯说,在OpenAI于2022年11月发布ChatGPT之后,微软研究院希望了解学术研究人员如何使用生成性人工智能并从中受益。该组织看到了一个机会,可以创建一个全球学术研究人员网络,专注于发展基础模型,以更好地将人工智能与人类目标结合起来,推进人工智能的有益应用和进一步的科学发现。AFMR计划还旨在支持一系列自愿承诺维加斯说,拜登政府起草该法案的目的是促进可信赖和安全的人工智能系统。

该赠款计划通过Azure AI服务提供对模型和可定制API的访问,这些服务利用了Azure的内置安全和合规协议,支持在医疗等敏感领域进行研究。该倡议还让参与者有机会在会议和虚拟活动中见面并相互学习,并与微软研究院的科学家合作。 

“获得资源是一回事,但通过观察其他人正在做什么来加速自己的研究是另一回事,”维加斯说。

她说,该倡议的最终目的是培育一个全球性和多样化的研究社区,并将人工智能应用于更大的利益。

她说:“我们希望确保人工智能不只是为少数人服务。我们的愿望是让人工智能成为全球变化的催化剂,造福于所有人。”。

相关链接:

上图:Alice Oh是KAIST计算机学院的教授,她是全球15个国家的学术研究人员之一,通过一项新的微软研究计划获得资助。由Jean Chung为微软拍摄。