1,011发现的研究成果

    应用成对排序优化改进翻译模型的插值

    获取PDF
    在统计机器翻译中,我们经常需要结合不同来源的并行训练数据来构建一个好的系统。这样做的一种方法是从每个数据集构建单独的翻译模型并对其进行线性插值,到目前为止,优化插值权重的主要方法是最小化heldout集上的模型复杂度。在这项工作中,我们没有针对这种间接度量进行优化,而是直接针对调优集上的BLEU进行优化,并显示了两个数据集和8个语言对的平均性能改进。

    将浅层转移机器翻译中的规则和词典集成到基于短语的统计机器翻译中

    获取PDF
    我们描述了一种混合策略,其目标是将浅层转换基于规则的机器翻译(RBMT)中的语言资源整合到基于短语的统计机器翻译(PBSMT)中。它主要包括使用匹配转移规则的双语短语对和浅转移RBMT系统的词典条目来丰富PBSMT系统的短语表。这种新策略利用了RBMT系统如何使用语言资源来分割要翻译的源语言句子,并克服了将RBMT系统视为黑盒的现有混合方法的局限性。实验结果证实,我们的方法比现有方法提供的翻译质量更高,并且当用于训练SMT系统的并行语料库较小或翻译RBMT词典涵盖的域外文本时,该方法特别有用。将该方法与最近提出的无监督浅层转移规则推理算法相结合,可以获得比基线PBSMT更高的翻译质量;在这种情况下,唯一使用的手工资源是RBMT中常用的词典。此外,使用自动推断规则构建的混合系统所获得的翻译质量与使用手工规则构建的系统所获得质量相似。西班牙经济和竞争力部通过TIN2009-14009-C02-01和TIN2012-32615项目资助的研究,Generalitat Valenciana通过ACIF 2010/174拨款资助的研究以及欧盟第七框架计划FP7/2007-2013根据拨款协议PIAP-GA-2012-324414(Abu-MaTran)资助的研究

    脑磁共振图像分析:分割与配准

    获取PDF

    视频中的时空人体行为检测与实例分割

    获取PDF
    随着视频捕获设备和数字视频内容的数量呈指数级增长,自动视频理解现在处于计算机视觉研究的前沿。本文提出了一系列视频中人体动作自动检测模型,并解决了时空动作实例分割问题。动作检测和实例分割在视频理解中都起着至关重要的作用。首先,我们提出了一种新的基于框架级深度特征表示和两步动态规划方法的人体行为检测方法。该方法利用基于深度学习的动作识别和对象检测方法的最新进展,获得框架级的动作表示。为了结合互补的外观和运动线索,我们引入了一种新的融合技术,显著提高了检测性能。此外,我们将时间行为检测视为两个能量优化问题,并使用Viterbi算法解决了这两个问题。利用视频级表示可以进一步让网络学习动作区域之间的帧间时间对应关系,它肯定是比帧级表示更适合动作检测问题的解决方案。其次,我们提出了一种新的深层网络结构,它通过对跨越两个连续视频帧的3D区域建议进行分类和回归,学习视频级的动作表示。所提出的模型是端到端可训练的,可以在单个训练步骤中针对提案生成和行动检测目标进行联合优化。我们将新网络命名为“AMTnet”(Action Micro-Tube回归网络)。我们进一步扩展了AMTnet模型,通过合并光学ow特征来编码动作的运动模式。最后,我们解决了动作实例分割的问题,其中同一类的多个并发动作可以从一个图像序列中分割出来。通过利用最近在动作前景背景分割方面的工作,我们能够将每个动作管与类特定分割相关联。我们证明了我们提出的模型在具有挑战性的动作检测基准上的性能,实现了全面的最新结果,并显著提高了测试时的检测速度

    交互式进化算法在图像增强和生成中的应用

    获取PDF
    图像增强和创建,尤其是出于审美目的,似乎很适合使用交互式进化算法。以前的工作集中在交互式进化算法的各个方面的开发以及它们在各种图像增强和创建问题中的应用。交互式进化算法中算法设计选项的稳健评估以及交互式进化算法与实现相同目标的替代方法的比较通常没有得到很好的解决。本文的工作主要涉及不同的交互式进化算法、搜索空间和操作符,用于设置图像处理和图像创建任务所需的输入值。第二个关注点是确定何时使用交互式进化算法解决图像增强问题,以及它与其他方法的比较。使用不同复杂度的任务,在许多专门设计的实验中实现并比较了各种交互式进化算法。关于交互式进化算法研究中的其他工作,本论文的一个新方面是对从实验中收集的数据进行统计分析。这一分析表明,与流行的假设相反,算法参数、运算符、搜索空间甚至底层进化算法的选择对结果图像的质量或开发时间几乎没有影响。研究发现,在实现交互式进化算法的用户界面时选择的交互方法对算法的性能有较大的影响

    面向方向不变二维形状匹配的有序形状编码与相关

    获取PDF
    人类的大脑和视觉系统在识别物体方面非常强大和高效。虽然计算机视觉领域中受生物启发的方法通常被认为是最先进的,对大脑和视觉系统工作尚未解锁。这种理解的好处是计算机视觉有两个方面:首先,一个更健壮的目标识别可以生成系统,其次是一个与大脑和视觉系统将大大降低电源需求。因此,它值得研究和评价生物启发的物体识别理论。本工程博士论文提供了一个生物启发的物体识别理论称为有序形状编码和相关性(OSCC)。该理论以相对编码和相关性为基础在人脑和视觉系统中。对该理论的推导进行了说明与提议的扩展一起实现。因此针对多个序列的相关性,提出了分层序列比对方法-用于方向不变2D形状上下文的维度有序形状描述符描述符匹配。给出了方向不变的二维形状描述符匹配评估它包括合成数据和公共MNIST手写数字数据集。综合数据评估表明,所提出的OSCC方法可以用作辨别方向不变的2D形状描述符。此外,还表明应用于MNIST手写数字数据集。然而,据显示,OSCC在消除外观和弯曲能量成本时,性能优于SC方法从SC方法比较纯形状描述符。未来的工作建议弯曲能量和外观成本被集成到OSCC管道中,以便进一步OCR评估

    使用树库诱导的概率分析器检测语法错误

    获取PDF
    今天的语法检查器通常使用手工创建的规则系统来定义可接受的语言。这种规则系统的开发是劳动密集型的,必须针对每种语言重复开发。同时,从句法注释语料库(树库)自动导出的语法成功地应用于其他应用,例如文本理解和机器翻译。乍一看,树库诱导的语法似乎不适合进行语法检查,因为它们具有很高的健壮性,大量生成过多且无法拒绝非语法输入。我们提出了三种用概率树库诱导语法判断句子语法性的新方法,证明了这种语法可以成功地应用于自动判断输入字符串的语法性。我们最有效的方法利用了语法树库和非语法树库上训练的语法的解析结果之间的差异。第二种方法使用语法训练数据构建最可能解析的概率的估计值,这些语法训练数据之前已经用解析概率进行了解析和注释。如果输入句子(其语法性由系统判断)的估计概率比实际解析概率高出一定数量,则该句子被标记为不合语法。第三种方法从解析的语法和非语法语料库中以CFG规则的形式提取有区别的解析树片段,并训练二元分类器来区分语法句子和非语法句子。这三种方法是在语法和非语法句子的大型测试集上进行评估的。非语法测试集是通过在英国国家语料库中插入常见语法错误自动生成的。将结果与两种传统方法进行了比较,一种方法使用手工编写的区分语法XLE ParGram English LFG,另一种方法基于部分话n-gram。此外,将基线方法和新方法结合在一个基于机器学习的框架中,从而实现了进一步的改进

    社会福利、不平等和贫困

    获取PDF
    我们对S.R.Chakravarty(Keio Economic Studies 34(1997),17-32)提出的基于无剥夺进行福利比较的广义满意度(在我们的术语中为非剥夺)准序进行了表征。我们表明,非剥夺准序服从转移原则的较弱版本:福利只会因渐进转移的特定组合而提高,这种组合要求从较富有的个人身上获得相同的金额,并将其分配给任意一个较贫穷的个人。我们确定了与这一原则相一致的扩展基尼社会福利函数的子类,并证明了这类函数中价值判断的一致性与非剥夺准序所隐含的分布的排序相同。我们通过考虑相应的相对和绝对伦理不平等指数,将该方法扩展到不平等的度量。出口多样化、FDI、增长、中东和北非地区、GMM体系

    对应场估计的PatchMatch置信传播及其应用

    获取PDF
    对应域估计是一个重要的过程,是许多不同应用程序的核心。它是否经常被视为一个能量最小化问题,通常被分解为两个能量项的组合最小化。第一个是一元能量或数据项,它反映了解决方案与数据的一致性。第二个是成对能量或平滑项,确保解决方案显示出一定程度的平滑度,这对许多应用程序都至关重要。本文探讨了将PatchMatch和Belief Propagation这两种成熟的对应字段估计算法结合起来的可能性,以便从两者的优点中获益,并克服它们的一些缺点。置信传播是一种常见的算法,可用于优化包括一元项和成对项的能量。然而,它的计算成本很高,因此不适用于成像应用中经常需要的连续空间。另一方面,PatchMatch是一种简单但非常有效的方法,用于优化连续高维空间上此类问题的一元能量。该算法有两个主要部分:通过采样更新解空间和使用空间邻域传播样本。我们展示了这些组件如何与称为粒子信念传播(PBP)的信念传播特定形式的组件相关。然而,PatchMatch缺少明确的平滑项。我们表明,将这两种方法结合起来,可以产生一种新的算法PMBP,与PatchMatch相比,该算法的性能有所提高,并且比PBP快几个数量级。我们将新的优化器应用于两种不同的应用:立体匹配和光流。我们通过一系列实验验证了PMBP的优点,并表明我们始终获得比PatchMatch和Belief Propagation更低的错误

    基于内容的多媒体信息检索中加权数据融合的研究

    获取PDF
    基于内容的多媒体信息检索(CBMIR)的特点是结合了噪声信息源,这些噪声信息源能够获得很好的性能。在本论文中,我们主要研究通过线性加权数据融合将独立检索专家的排名结果组合在一起,构成CBMIR系统。独立检索专家是低级多媒体特征,每个特征都包含一个索引函数和排序算法。本论文由两部分组成。在上半年,我们对影响线性加权数据融合性能的因素进行了严格的实证研究。在下半年,我们利用这些发现创建了一类新的数据融合权重生成算法,这些算法是能够在查询时确定权重,因此权重取决于主题
    核心核心