多状态隐Markov统计模型的基本原理及其应用
马尔可夫,人脸识别,语音,1隐马尔可夫模型的基本原理,2隐马尔可夫模型的应用现状
潘海燕 孔丹莉 胡利人 于海兵 丁元林多状态隐Markov统计模型的基本原理及其应用
潘海燕 孔丹莉 胡利人 于海兵 丁元林
隐马尔可夫模型;慢性病学;语音识别;生物信息学;人脸识别
隐马尔可夫模型(hidden Markov model,HMM )是一类统计模型,经典理论于20世纪60年代末70年代初由L.E.Baum等提出,20世纪70年代中期开始应用于语音识别领域。目前被广泛应用于基因关联分析和基因识别、图像识别、孤立词识别和目标跟踪等方面。本文对 HMM基本原理和目前应用现状进行综述,旨在为HMM的深入探讨提供参考。
1 隐马尔可夫模型的基本原理
马尔可夫在1906-1912年间,提出并研究了一种能用数学分析方法研究自然过程的一般图式-马尔可夫链(Markov Chain)。其研究方法和重要发现推动了概率论的发展,特别是促进了概率论信分支-随机过程论的发展。所以从某种程度上说随机过程又叫作马尔可夫过程(Markov Process)HMM是马尔可夫模型(Markov model)的进一步发展。该模型认为模型的状态是不可观测的(这便是“隐”得名的由来),可以观测到的只是在这些状态下的各种表现形式。例如,睡眠的按阶段分为清醒期、快速眼动期、S1、S2、S3、S4这6个期,它们便是“状态”;可以观测到的则是在这些状态下的各种生理参数表现,例如在脑电图上的表现[1]。HMM是一种双重随机模型[2],它由两个相互关联的随机过程组成,其一是隐蔽有限状态的Markov链,另一个是与Markov链的每一个状态相关的观察结果的随机过程[3]。观察到的事件与状态并不是一一对应,而是通过一组概率分布相联系。
研究 HMM需要解决三个问题:学习问题、识别问题和解码问题,对这三个问题的回答构成了HMM理论。对HMM的基本原理主要从参数估计和假设检验两个方面阐述。
1.1参数估计
HMM的基本要素用模型五元组λ=(N,M,π,A,B)简单描述,或简写为 λ=(π,A,B)。N表示状态数目,M表示每个状态可能的观察值数目,A表示与时间无关的状态转移概率矩阵,B表示给定状态下观察值概率的分布,π表示初始状态下的概率分布。HMM需要估计如下三个主要参数[2]。

②观察概率bj(k)=Pr[uk(sj)] ......
您现在查看是摘要页,全文长 9994 字符。