3,539发现的研究成果

    基于SMT的无监督神经机器翻译正规化

    全文链接
    没有真正的双语语料库,无监督神经机器翻译(NMT)通常需要使用模型训练的反译方法。然而,由于脆弱监督,伪数据不可避免地会包含噪音和错误在随后的培训过程中积累和强化,导致不良翻译性能。为了解决这个问题,我们引入了基于短语的统计机器翻译(SMT)模型对噪声数据具有鲁棒性用于指导非监督NMT模型训练的后验正则化迭代反译过程。我们的方法从构建的SMT模型开始使用预先训练的语言模型和推导出的单词级翻译表跨语言嵌入。然后对SMT和NMT模型进行联合优化并在统一的EM框架中相互促进。这样,(1)迭代反译过程中错误的负面影响可以通过SMT过滤短语表中的噪声来及时缓解;同时,(2)NMT可以弥补表面贴装技术。在en-fr和en-de翻译任务上进行的实验表明,我们的该方法优于强大的基线,达到了新的最先进水平无监督的机器翻译性能。评论:将在2019年AAAI大会上提交;9页,4图

    基于词汇和未标记数据的神经网络汉语分词后正则化

    全文链接
    现有的CWS方法通常依赖于大量标记句子训练分词模型,这对注释。幸运的是,未标记的数据通常很容易收集高质量的汉语词典是现成的,两者都可以提供CWS的有用信息。在本文中,我们提出了一种用于可以利用词典和未标记数据的中文分词。我们的方法基于后验正则化算法的变体,并且未标记的数据和词汇作为间接数据纳入模型训练通过规范CWS模型的预测空间进行监督。广泛的域内和跨域多个基准数据集的实验场景验证了我们方法的有效性。评论:2019年万维网大会接受了7页11图(网址:19

    逆问题的任务自适应重构

    全文链接
    本文考虑了执行模型上定义的任务的问题仅通过不适定中的噪声数据间接观测到的参数逆问题。一个关键方面是使重建步骤正规化统计中任务作为适当的估计量(非随机决策规则)估计问题。该实现利用(深层)神经网络为二者提供估计量族的可微参数化步骤。将这些网络结合起来,针对合适的监督训练数据以最小化联合可微损失函数,从而产生一种端到端的适应任务的重建方法。这个建议的框架是通用的,但具有适应性,具有即插即用结构用于调整逆问题和手头的任务。更准确地说,相关的数据模型(前向算子和噪声统计模型)与逆问题是可交换的,例如通过使用神经网络通过学习的迭代方法给出的体系结构。此外可以使用可编码为可训练的神经网络。方法是关节断层图像重建、分类和关节断层图像重建分割

    逆量子统计的贝叶斯方法

    全文链接
    发展了一种非参数贝叶斯方法来确定量子有限温度下量子系统经验数据的势。这个该方法将量子力学的似然模型与先验相结合以随机过程形式实现的势信息。具体优点是可以处理异构数据和明确表达先验信息,即直接根据潜在利益。最大后验概率的数值解近似对于一维问题是可行的。使用正确的事实证明,先验信息至关重要。注释:4页,6个图,版次
    核心核心