信号处理基础与趋势®>第18卷>第1-2期

基于能量的模型及其在语音和语言处理中的应用

欧志坚中国清华大学,ozj@tsinghua.edu.cn

 
建议引用
欧志坚(2024),“基于能量的模型在语音和语言处理中的应用”,《信号处理的基础和趋势》:第18卷:第1-2期,第1-199页。http://dx.doi.org/10.1561/20000117

出版日期:2024年3月14日
©2024中瓯
 
学科
统计信号处理,  统计/机器学习,  语音和口语处理,  随机优化,  深度学习,  图形模型,  马尔科夫蒙特卡洛,  变分推理,  分类和预测,  概率与统计
 

免费预览:

下载摘录

分享

下载文章
在本文中:
1.简介
2.EBM基础
3.序列数据的EBM及其在语言建模中的应用
4.有条件EBM及其应用
5.联合EBM和应用程序
6.结论
致谢
附录
工具书类

摘要

基于能量的模型(EBM)是一类重要的概率模型,也称为随机场和无向图形模型。EBM是非规范化的,因此与其他流行的自规范化概率模型(如隐马尔可夫模型(HMM)、自回归模型、生成对抗网(GAN)和变分自动编码器(VAE))截然不同。近年来,EBM不仅吸引了核心机器学习的兴趣,而且也吸引了语音、视觉、自然语言处理(NLP)等应用领域的兴趣,在理论和算法方面取得了重大进展。据我们所知,目前还没有关于语音和语言处理应用的EBM的评论文章。语音和语言的连续性也带来了特殊的挑战,需要不同于处理固定维数据(例如图像)的处理方法。

本专著的目的是系统介绍基于能量的模型,包括算法进展以及在语音和语言处理中的应用,分为四个主要部分。首先,我们将介绍EBM的基础知识,包括经典模型、由神经网络参数化的最新模型、采样方法以及从经典学习算法到最先进的各种学习方法。接下来的三节将介绍如何在三种不同的场景中应用EBM,即分别为边际分布、条件分布和联合分布建模。1) 序列数据的EBM与语言建模应用,其中我们主要关注序列本身的边际分布;2) 用于建模给定观测序列的目标序列的条件分布的EBM,在语音识别、序列标记和文本生成中的应用;3) EBM用于建模观测序列和目标的联合分布,及其在半监督学习和校准自然语言理解中的应用。此外,我们将介绍一些开源工具包,以帮助读者熟悉开发和应用基于能量的模型的技术。

内政部:10.1561/2000000117
国际标准图书编号:978-1-63828-306-5
222页99.00美元
购买书籍(pb)
 
国际标准图书编号:978-1-63828-307-2
222页310.00美元
购买电子书(.pdf)
目录:
1.简介
2.EBM基础
3.序列数据的EBM及其在语言建模中的应用
4.有条件EBM及其应用
5.联合EBM和应用程序
6.结论
致谢
附录
工具书类

基于能量的模型及其在语音和语言处理中的应用

基于能量的模型(EBM)是一类重要的概率模型,也称为随机场和无向图形模型。EBM是非规范化的,因此与其他流行的自规范化概率模型(如隐马尔可夫模型(HMM)、自回归模型、生成对抗网(GAN)和变分自动编码器(VAE))截然不同。

在过去的几年里,由于显著的理论和算法进步,EBM不仅吸引了核心机器学习社区的兴趣,也吸引了语音、视觉、自然语言处理(NLP)等应用领域的兴趣。语音和语言的连续性也带来了特殊的挑战,需要与处理固定维数据(例如图像)不同的处理方法。因此,本专著的目的是系统介绍基于能量的模型,包括算法进展以及在语音和语言处理中的应用。首先,介绍了EBM的基本知识,包括经典模型、神经网络参数化的最新模型、采样方法以及从经典学习算法到最先进的各种学习方法。然后,介绍了EBM在三种不同场景中的应用,即分别用于建模边际分布、条件分布和联合分布。1) 序列数据的EBM与语言建模应用程序,其中主要关注序列本身的边际分布;2) EBM用于建模给定观测序列的目标序列的条件分布,并应用于语音识别、序列标记和文本生成;3) EBM用于建模观测序列和目标的联合分布,及其在半监督学习和校准自然语言理解中的应用。最后,介绍了几个开源工具包,以帮助读者熟悉开发和应用基于能量的模型的技术。

 
SIG-117公司