可组合的数据中心框架自然语言处理工作流

刘正中,关雄丁,阿维纳什·布基图,曼西·古普塔,彭志高,阿蒂夫·艾哈迈德,张世坤,新高,斯瓦普尼·辛哈维,李林伟,魏伟,胡泽聪,石浩然,梁晓丹,Teruko Mitamura公司,Eric Xing(埃里克·星),胡志婷


摘要
应用领域(如医疗保健、金融、教育)中的经验自然语言处理(NLP)系统涉及多个组件之间的互操作,从数据摄取、人工注释到文本检索、分析、生成和可视化。我们建立了一个统一的开源框架,以支持以可组合的方式快速开发此类复杂的NLP工作流。该框架引入了一种统一的数据表示,用于对各种NLP任务的异构结果进行编码。它为NLP任务、可视化和注释提供了一个大型处理器存储库,可以在统一表示下轻松组装,实现完全互操作性。该高度可扩展的框架允许从外部非现成NLP和深度学习库插入自定义处理器。整个框架通过两个模块化但可集成的开源项目交付,即Forte(用于工作流基础设施和NLP功能处理器)和Stave(用于用户交互、可视化和注释)。
选集ID:
2020.emnlp-demos.26
体积:
2020年自然语言处理实证方法会议记录:系统演示
月份:
十月
年份:
2020
地址:
在线的
编辑:
Qun Liu(刘群),大卫·施兰根
地点:
EMNLP公司
SIG公司:
出版商:
计算语言学协会
注:
页:
197–204
语言:
网址:
https://aclantology.org/2020.emnlp-demos.26
内政部:
10.18653/v1/2020.emnlp-demos.26
双钥匙:
引用(ACL):
刘正忠、丁冠雄、阿维纳什·布基图、曼斯古普塔、高鹏志、阿蒂夫·艾哈迈德、张世坤、高欣、斯瓦普尼尔·辛哈维、李林伟、魏伟、胡泽聪、石浩然、梁晓丹、三村泰郎、邢埃里克和胡志亭。2020年。可组合NLP工作流的数据中心框架.英寸2020年自然语言处理实证方法会议记录:系统演示,第197-204页,在线。计算语言学协会。
引用(非正式):
用于可组合NLP工作流的以数据为中心的框架(Liu等人,EMNLP 2020)
复制引文:
PDF格式:
https://aclantology.org/2020.emnlp-demos.26.pdf
代码
无症状/强直