改进语义分析中的合成泛化

@正在进行{Oren2020即兴CG,title={改进语义分析中的合成泛化},author={Inbar Oren和Jonathan Herzig、Nitish Gupta、Matt Gardner和Jonatnathan Berant},booktitle={Findings},年份={2020年},网址={https://api.semanticscholar.org/CorpusID:222291650}}
本文分析了各种模型,并对语义解析器的注意模块提出了多个扩展,目的是改进语义分析中的合成泛化,因为输出程序是由子组件构造的。

询问这篇论文
AI供电

基于语义标记的合成泛化

这项工作将解码分解为两个阶段,首先用表示其单个单词含义的语义符号标记输入话语,然后使用序列到序列模型预测最终的意义表示条件和预测的标记序列。

组合泛化和自然语言变异:语义分析方法能同时处理这两者吗?

NQG-T5是一种混合模型,它将高精度基于语法的方法与预训练序列到序列模型相结合,在非合成数据的若干合成泛化挑战中表现优于现有方法,同时在标准评估方面也具有竞争力。

语义分析中模型尺度对合成概括的影响评估

本文强调了当前有效利用模型尺度进行合成泛化的技术的局限性,同时分析也为未来的工作提供了有希望的方向。

大海捞针:从合成数据中抽取结构双向训练集用于合成泛化

本文研究了自动生成合成语句-程序对以改进语义分析中的合成泛化,并选择了一个子集结构上是双向的合成示例,并使用它们来改进合成泛化。

基于Wikidata的多语言语义分析中的合成泛化

提出了一种基于Wikidata的多语言并行问题查询对数据集的创建方法,并用于分析希伯来语、卡纳达语、汉语和英语语义解析器的合成泛化。

利用潜在结构和数据增强改进作文概括

这项工作提出了一种更强大的数据重组方法,该方法使用了一个名为合成结构学习者(CSL)的模型,这是一个具有准同步无上下文语法主干的生成模型,在两个现实世界的合成泛化任务中,该模型甚至比T5-CSL集成更强。

基于跨层监督注意的神经语义分析合成泛化

我们描述了一种改进语义解析器中合成泛化的跨级监督注意力损失。我们的方法建立在现有损失的基础上,这些损失鼓励神经中的注意力图

用翻译数据集评估多语言合成泛化

对MCWQ数据集进行了基于规则的忠实翻译,将其从英语翻译为汉语和日语,结果表明,由于语言差异,作文的分布仍然受到影响,多语言模型仍然难以实现跨语言的作文泛化。

通过跨语义分析任务的转换学习组合泛化

这项工作研究了有助于将学习从一个组合任务转移到另一个任务的学习表示法:模型的表示法和特定任务层在预微调任务上进行了不同的策略训练,以便它们能够很好地概括需要组合性的不匹配分割。

使用中间表示解锁预训练模型中的合成泛化

需要强调的是,中间表示为提高预训练seq2seq模型的合成泛化能力提供了一个重要且可能被忽视的自由度。
...

用于神经语义分析的数据重组

数据重组提高了RNN模型在三个语义解析数据集上的准确性,为具有可比监管的模型在标准GeoQuery数据集上带来了最先进的性能。

半结构化表的带类型约束的神经语义分析

一种新的语义解析模型,用于回答半结构化维基百科表上的合成问题,具有最先进的准确性、类型约束和实体链接,是神经语义解析器中很有价值的组件。

CLOSURE:评估CLEVR模型的系统泛化

令人惊讶的是,人们发现,明确组成的神经模块网络模型在CLOSURE上的泛化能力也很差,即使它在测试时可以访问基本事实程序。

用于文本推理的神经模块网络

这项工作扩展了神经模块网络,引入了对文本段落进行推理的模块,以概率和可微的方式对数字和日期进行符号推理,并提出了一种无监督的辅助损失来帮助提取与文本中事件相关的参数。

使用几个部分注释的示例将解析器扩展到远程域

结果表明,当目标域与源域在语法上相似时,单词表示的最新进展大大减少了域适应的需要,并且提供了一种仅使用几十个部分注释来适应解析器的简单方法。

基础语言理解中系统概括的基准

引入了一个新的基准gSCAN,用于评估情境语言理解模型中的合成泛化,它从形式语言学中的意义合成标准模型中获得灵感,并定义了基于网格世界状态的语言。

BERT:用于语言理解的深层双向变形金刚预训练

一种新的语言表示模型BERT,旨在通过联合调节所有层中的左右上下文来预处理未标记文本的深层双向表示,只需一个额外的输出层即可对其进行微调,以创建适用于广泛任务的最先进模型。

学习在图像理解中概括新的构图

有人认为,结构化表示和组合分割是图像字幕的有用基准,并提倡能够捕捉语言和视觉结构的组合模型。

重排熟悉的:在递归网络中测试合成泛化

系统组合性是指将有意义的单元与常规和可预测的结果重新组合的能力,它被视为人类语言泛化能力的关键。最近的工作

分解:理解基准的问题

本文介绍了问题的问题分解意义表示(QDMR),并通过证明QDMR可以用于改进HotpotQA数据集上的开放域问答,并且可以确定性地转换为伪SQL形式语言,从而证明了QDMR的实用性,这可以减轻语义解析应用程序中的注释。