重点关注:马尔可夫链是一种概率模型,它描述了一系列观察结果,这些观察结果的发生仅在统计上依赖于之前的观察结果。
● 语音、股价走势等时间序列数据。
● 句子中的单词。
● DNA阶梯梯级上的碱基对。
状态和过渡
假设我们想模拟驾驶者的行为。可能的行为包括
● 加速(状态1)
● 恒速(状态2)
● 怠速(发动机缓慢运转,但车辆未移动–(状态3))
● 制动器(状态4)
让我们将这些行为中的每一种称为状态。在给定的示例中,有N=4状态,将其称为Q={Q1,q个2,q个三,q个4}.
我们在驾驶员的行为中观察到以下模式(图1)。也就是说,驾驶员通过特定的状态序列操作车辆。在图1所示的图表中状态表示为节点和过渡作为边缘.
我们看到,有时驾驶员会将车辆的状态从一种状态更改为另一种状态,有时会保持相同的状态(如箭头所示)。
我们还注意到,车辆要么保持在相同状态,要么更改为下一个状态。因此,从这个模型来看,如果我们想预测未来的状态,最重要的是车辆的当前状态。过去的国家与未来的国家无关,除非通过现在的国家。现在请注意这一重要假设。
概率模型
我们知道,我们无法确定驾驶员在任何给定时间点的行为。因此,为了对这种不确定性建模,将模型转换为概率模型概率模型允许我们解释行为或状态变化的可能性。
图2给出了给定问题的概率模型示例。
在这个概率模型中,我们为转换分配了概率值。这些概率统称为转移概率例如,考虑到名为“怠速”的状态,汽车从该状态过渡到下一状态(加速)的概率为0.8。在概率数学中,这表示为以先前状态为条件的条件概率。
p(状态=“加速”|先前状态=“怠速”)=0.8
通常,转移概率以矩阵的形式表示,称为转移概率矩阵转移概率矩阵如图2所示。在转换矩阵中,表示为A类,每个元素一ij公司表示从状态转换的概率我声明j个.转移矩阵的元素满足以下属性。
也就是说,离开任何给定状态的转移概率之和为1.
众所周知,在本例中,驾驶员无法在任何状态下启动汽车(例如,无法在“恒速”状态下启动车辆)。他只能从静止状态(即制动状态)启动汽车。为了建模这种不确定性,我们引入π我–马尔可夫链在给定状态下开始的概率我。所有N个状态称为初始概率分布(π=π1,π2, …,πN个). 在图3中,启动概率用绿色箭头表示。
马尔可夫假设
如定义中所述,本例中的马尔可夫链假设每个事件/观察的发生仅在统计上依赖于前一个事件/观察。这是一个一阶马尔可夫链(或称为二元语言模型在自然语言处理应用程序中)。对于各州Q={Q1,…,qn个},预测未来状态的概率仅取决于当前的观察结果,所有其他先前的观察结果都无关紧要。就概率而言一阶马尔可夫链假设表示为
扩展假设米第个 有序马尔可夫链,预测未来观测的概率仅取决于前一个米观察。这是一个m-gram模型.
给定一组n个任意随机变量/观测值Q={Q1,…,qn个},它们的联合概率分布通常通过应用以下链式规则来计算。
然而,如果问本质上是顺序的,遵循通用米第个顺序马尔可夫链模型,简化了联合概率的计算。
图4总结了一阶和二阶马尔可夫模型的马尔可夫假设。图4:一阶和二阶马尔可夫链的假设
隐马尔可夫模型(HMM)
马尔可夫链在计算可观察到的事件然而,在许多实际应用程序中,我们感兴趣的事件通常是隐藏的,即我们不直接观察它们。需要推断这些隐藏事件。例如,给定一个自然语言的句子,我们只直接观察单词和字符。句子中的词性是隐藏的,必须进行推断。这就引出了下一个讨论主题——隐马尔可夫模型.
评价此帖子:(5平均票数:4.20共5个)
作者的书籍
类似主题