disco:生成模型分布式控制工具包

Germanán Kruszewski先生,乔斯·罗森,马克·戴米特曼


摘要
预训练的语言模型和其他生成模型已经彻底改变了NLP以及其他语言模型。然而,这些模型往往会重现训练数据中存在的不良偏见。此外,他们可能忽略了重要但难以捕获的模式。为了解决这些局限性,研究人员引入了分布式控制技术。这些技术不仅限于语言,还可以控制模型输出中任何感兴趣特征的流行程度(即期望值)。尽管这些技术具有潜力,但由于难以适应复杂的、断开连接的代码,它们的广泛采用受到了阻碍。在这里,我们介绍disco,一个开源Python库,它将这些技术带给更广泛的公众
选集ID:
2023.acl-demo.14年
体积:
计算语言学协会第61届年会会议记录(第3卷:系统演示)
月份:
七月
年份:
2023
地址:
加拿大多伦多
编辑:
达努什卡·博莱加拉,黄瑞红,阿兰·里特
地点:
国际计算语言学协会
SIG公司:
出版商:
计算语言学协会
注:
页:
144–160
语言:
网址:
https://aclantology.org/2023.acl-demo.14
内政部:
10.18653/v1/2023.acl-demo.14版
奖励:
演示轨道:杰出论文奖
比比键:
引用(ACL):
Germanán Kruszewski、Jos Rozen和Marc Dymetman。2023disco:生成模型分布式控制工具包.英寸计算语言学协会第61届年会会议记录(第3卷:系统演示),第144-160页,加拿大多伦多。计算语言学协会。
引用(非正式):
disco:生成模型分布式控制工具包(Kruszewski等人,ACL 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.acl-demo.14.pdf
视频:
 https://aclantology.org/2023.acl-demo.14.mp4