心音_模式识别_人工神经网络_心音信号的识别与分类

心音信号的识别与分类

http://www.100md.com 《生物医学工程学杂志》 1999年第3期

     作者：王衍文王海滨程敬之

    单位：西安交通大学生物医学工程与仪器系，西安 710049

    关键词：心音；模式识别；人工神经网络

    生物医学工程学杂志990328 摘要综述了心音信号识别与分类的基本方法(统计分析方法、神经网络方法)及其研究进展，并对各种方法中存在的主要问题进行了探讨

    Recognition and Classification of Heart Sounds

    Wang Yanwen Wang Haibin Cheng Jingzhi

    (Department of Biomedical Engineering and Instrumentation,Xi'an Jiaotong University,Xi'an 710049)
, http://www.100md.com
    Abstract This paper reviews the methods and research advances of recognition and classification of heart sounds. The methods include the statistical techniques and artificial neural network. It also discusses the main problems in the methods.

    Key words Heart sounds Pattern recognition Artificial neural network

    1 引言

    随着现代社会物质生活水平的改善，心血管疾病的发病率和死亡率已越来越高。统计资料表明，在我国因心血管疾病死亡者占总死亡人数的44%。美国1978年报道了4000万人有不同形式的心血管疾病，死于心脏病者近100万人。可见，心脏病已成为危害人类健康的多发病和常见病。因此，心脏系统疾病的防治和诊断成为医学界面临的首要问题之一。
, 百拇医药
    心音是心脏及心血管系统机械运动状况的反映，其中包含着心脏各个部分本身及相互之间作用的生理和病理信息。心音信号的识别与分类对心血管系统疾病的诊断具有重要的意义，其准确性、可靠性的好坏决定着诊断与治疗心脏病患者的效果。早期的心音识别与分类是医生根据听诊结果来完成的，显然这一过程具有一定的主观性且可靠性不高。随着信号处理与分析技术的不断发展，对心音的研究也逐步由定性分析进入了定量分析的阶段。国内外许多生物医学工程研究人员将传统的模式识别方法，以及神经网络方法用于心音的识别与分类，期望实现心音的自动解释和自动诊断，以便向临床医生提供实用的辅助诊断信息。此外，心音的识别与分类还有助于对心音产生机制的理解。

    心音信号识别与分类的方法是多种多样的，本文重点介绍了实际中应用较多的基于统计分析以及神经网络的识别与分类方法。

    2 统计模式识别方法

    统计模式识别方法是在对模式结构进行测量和变换的基础上进行分类的。基于统计方法的分类器的性能取决于特征和特征向量的概率分布，这些方法把模式作为随机向量对待，实际上意味着同一类型的模式的分布近似是高斯型的，通常运用线性方法把特征或性质聚类。
, http://www.100md.com
    根据心音的参数模型提取心音信号的特征参数，用统计分析的方法建立判别函数，采用逐步多元分析来自动筛选特征量，以提高分类的效果。这其中有Joo^[1]和Bement^[11]的极-零点模型法。他们根据临床经验选择出特征矢量x=

，其中f₁和f₂为对应两个最大谱峰处的频率，且f₁处的功率大于f₂处的功率。采用以最大熵为准则的Steightz-McBride法(8个极点、8个零点的极-零点模型)求得经过瓣膜修复术后的主动脉瓣关闭音。分类器为二次高斯型，它以双曲线型式将特征空间分为两个部分，根据特征矢量在特征空间的分布区域差别是正常或异常心音。对20例样本的分类结果表明，正确识别率为17/20。而在误判中除一例远离临界线外，其它两例均位于临界线附近。90年代初Durand等^[2]针对猪心生物替换二尖瓣的关闭音，研究了它的模式识别。他们分别采用高斯-贝叶斯模型和基于最邻近原则的距离测量算法，并比较了两种模式识别方法检测瓣膜变性的诊断特性。研究中通过两类指导学习处理来决定由6个或更少的参数组成的最优判别模式，分类器的错误概率用“余一”法来估计。此后的进一步研究中^[3]，他们结合四种窗函数的两种谱分析方法(快速富里叶变换、AR模型)，采用两类分类器(贝叶斯模型、基于最邻近原则的距离测量算法)检测心脏瓣膜的特性。对95个病人进行了评估，其中47个病人在主动脉瓣施行猪瓣膜生物修复(24人正常，23人瓣膜变性)，48个病人在二尖瓣施行猪瓣膜生物修复(19人正常，29人瓣膜变性)。对于每一类瓣膜，从瓣膜关闭音谱中提取21个参数对识别系统进行训练和测试，并在21个参数中选择2～5个综合参数进行估计。结果表明，FFT结合最近点分类器具有最佳性能：用汉宁窗对主动脉瓣的正确分类率为87%，用矩形窗对二尖瓣的正确分类率为94%。采用AR模型的结果为：用最近点分类器结合汉宁窗对主动脉瓣的正确分类率为81%，用贝叶斯分类器结合海明窗对二尖瓣的正确分类率为92%。
, 百拇医药
    对心脏的生物动力学模型的分析表明^[4，14]，心脏是一个非线性的、时变的复杂系统。因此，心音信号具有很强的非平稳性和随机性，这种随机性与呼吸状态、心脏的血流动力学状态以及人所处环境等各种不确定因素有关。统计模式识别方法的局限性在于，规范化的特征向量限制了识别系统的灵活性，使得系统对可获取信息的利用率降低，在一定程度上影响了系统的性能。

    3 神经网络模式识别

    人工神经网络是由非处理单元组成的非线性大规模自适应动力系统。它采用分布方式存储信息，具有联想记忆的功能，其处理单元执行非线性运算，使网络具有很强的自适应和容错能力，用它进行信号处理和模式识别可以更接近于人类思维。人工神经网络还具有许多优良的特性：

    (1)非线性在人工神经网络中，神经元处于激活或抑制两种状态，在数学上表现为非线性关系。具有阈值的神经元过程构成网络有更好的性能，可以提高容错性和存储容量；
, http://www.100md.com
    (2)非局域性神经网络的整体行为不仅取决于单个神经元的特征，而且更多地取决于各个神经元之间的相互联接、相互作用；

    (3)非定常性神经网络具有自适应、自组织和自学习能力，在处理信息的同时，其非线性动力系统本身也在不断地变化；

    (4)非凸性神经网络具有多个较稳定的平衡态，导致系统演化的多样性。

    总之，人工神经网络是在结构上模仿生物神经连接的系统，能够设计来进行模式识别工作。但是，神经计算不同于统计模式识别，它不是算法型的方法。因此，神经网络系统需要有存储信息的能力，而且是可以训练的，即系统经过训练后对于任何给定的输入都能给出期望的输出。神经网络模式识别系统的某些组成部分经常是用试算法得到的，而且它是不稳健的。如果要解决的不是一个特定的问题，而是一个一般性的问题，那么就需要一组系统。

    3.1 网络输入特征矢量
, http://www.100md.com
    网络输入特征矢量的确定，在神经网络模式识别方法中具有重要的作用。输入特征的选取直接关系着网络识别方法及结果的准确性，对于生物医学信号而言，常用的网络输入特征有时域波形、线性预测系数、预测误差、带通滤波器组、短时富里叶变换谱、倒谱以及小波变换谱。

    3.1.1 时域波形特征矢量时域波形包含着信号的所有信息，对于确定性信号，或信号的随机变化不很大并且数据长度在一定范围的随机信号，可以作为神经网络的输入特征。德国Paderborn大学的研究人员研究了不同的心脏监护方法，将神经网络用于估计心收缩期和心舒张期，用于从心音图输入信号分析先天性和后天性心脏病^[9]。把心音数据不加任何预处理或只做简单的滤波处理后直接作为神经网络的输入，其优点在于体现客观真实性，发挥神经网络自动提取特征和进行模式识别与分类的功能，避免了数据处理方法中人为因素的渗入。但是也存在一定的缺点：(1)输入数据较多，使得网络规模大，计算代价高，需要学习的样本多；(2)对于心音信号而言输入节点的含义不明确，通常要求网络具有移不变性，使得网络结构较为复杂。此外，心音信号既是非平稳的又是非线性的，其时域波形的幅值和相位均呈现随机性的变化。直接将心音图作为网络的输入特征，由于信号随机变化的影响，不易对心音进行准确的分类。因此，心音图多用于临床上辅助诊断，而在一般的网络识别系统中不常采用。
, 百拇医药
    3.1.2 线性预测系数特征矢量对心音信号建立模型(AR或ARMA)得到线性预测系数，是获取心音信号特征的方法之一。线性预测系数具有较高的压缩率，并且能够反映信号的大部分信息。Akay^[5，6]将神经网络用于冠状动脉声音的检测，作者首先利用自适应线性增强方法减小舒张期心音的背景噪声，再对滤波后的心音计算平均自相关函数延迟，采用修正的Yule-Walker自回归模型，用于计算平均线性预测系数的每个病人的数据要经过10个心周期的平均，在每个病人的记录上计算已滤波的线性预测系数。并将这些参数形成一个10点模拟特征矢量，作为神经网络的输入。所用神经网络为三层BP网络，对网络的测试表明，10个输入节点、10个隐层节点和2个输出节点的网络性能最佳。网络正确识别了64个冠状动脉疾病病人中的50个以及36个无明显阻塞病人中的32个，网络的检出率为78.1%、假阳性率为11.1%。

    作为神经网络输入的线性预测系数是信号分成若干段，然后对每一段建立AR模型得到的，并且假定每段信号是平稳的零均值随机信号。对于心音信号，由于生理和环境等因素的影响，每一心动周期的信号具有明显的时变性和随机性。因此，从严格的意义上来说，具有非平稳特性的心音信号本身不满足建立AR模型的条件。不难理解采用AR模型对心音信号建模，并且以线性预测系数作为识别特征而产生识别分类误差的原因。此外，在心音信号建模过程中，模型介数的确定也是至关重要的。一般情况下，AR模型阶数过低，会使AR谱不能准确反映信号的谱峰，表现在线性预测系数上，会使信号的部分信息丢失；而AR模型阶数过高，可能导致AR谱产生分裂，造成线性预测系数包含错误信息。目前各种确定AR模型阶数的准则均不很理想，在实际应用中通常依靠试验来确定阶数。另外对于带噪声的信号，模型的性能下降很快。
, 百拇医药
    3.1.3 倒谱特征矢量心音的倒谱是对心音信号进行同态处理得到的，同态处理对一段心音信号的对数谱的富里叶反变换进行线性滤波，并将其分离或解卷为两个分量，一个可认为是心胸声传输系统的冲激响应，另一个可视为瓣膜的振动和血液流动产生的激励源的作用。同态处理中假设信号可以表示为线性的、随时间慢变化的系统的输出。对于某些心音信号，它们满足此条件。例如二尖瓣狭窄时的全收缩期杂音，其激励源产生于收缩期血液由心室向心房时狭窄的二尖瓣的振动。对此类杂音进行同态处理，可以得到心杂音的源特性和基音周期，据此可以估计二尖瓣瓣膜的狭窄程度等生理病理参数。然而，对于大多数心音信号同态处理的前提条件常常难以满足。Durand^[4]的研究结果表明，心胸声传输系统具有很强的时变性，在心动周期的不同时刻，心脏的动力学特性是有差异的。显然心音信号不能表示为随时间慢变化的线性系统的输出。此外，产生心音的激励源不止一个，并且各激励源之间的相互作用呈随机性。因此，从理论上讲，对心音信号进行同态处理得到的倒谱有可能造成生理含义的混淆，以倒谱作为神经网络的输入，其识别结果也不会准确。
, 百拇医药
    3.1.4 短时富里叶变换谱特征矢量短时富里叶变换是一种应用较为广泛的时频分析方法，它假设非平稳信号为短时平稳的，采用滑动窗截取信号，对截取的信号作富里叶变换得到信号的谱图。分析窗的类型和长度对结果的影响是很关键的。但是无论怎样选择窗，短时富里叶变换的时间分辨率和频率分辨率总是矛盾的，这是由测不准原理所决定的，也就是说不可能同时获得较高的时间分辨率和频率分辨率。在具体应用时，应根据信号的时频域特征，合理选取窗函数及相应参数。

    Guo等^[7]设计了一个三层BP网络用于检测在主动脉瓣植入生物替代性瓣膜的瓣膜关闭音，并对其进行分类。他们分别以富里叶变换谱和线性预测系数作为网络的输入特征矢量，研究结果表明，隐层单元在2～20之间较为合适，对于不同的输入特征矢量，其最佳网络结构分别为：5-7-2(功率谱特征为输入特征矢量)，12-9-2(线性预测系数为输入特征矢量)。对47个病人的分析结果表明，以功率谱特征为输入特征矢量的网络的正确识别率为85%，以线性预测系数为输入特征矢量的网络的正确识别率为89%。
, 百拇医药
    3.1.5 小波变换谱特征矢量所谓小波就是满足可容性条件的具有特殊性质的函数或称小波基函数，而小波变换就是选择适当的基本小波或称母波，通过对基小波平移、伸缩而形成一系列的小波，然后将欲分析的信号投影到由平移、伸缩小波构成信号空间之中。这种平移、放大、缩小是小波变换的一个特点，因而可以在不同的频率范围、不同的时间位置对信号进行分析。小波变换以其对信号的非线性成分的反映能力及其稳健性越来越广泛地用于生物医学信号的分析中。

    文献[10]设计了一个适合于对信号的时频谱进行分类的两维ART-2神经网络，利用小波变换谱作为神经网络的输入特征，实现了识别系统的特征提取、特征压缩和特征定位。文中采用二进非正交小波变换，小波基函数为Morlet小波。分析结果显示采用该小波基有助于消除心音信号中较强的相位随机性的影响，使小波变换谱在各个尺度上的分布具有较好的稳定性，提高了网络识别的性能。而采用离散正交的小波分解得到的在各个尺度上的信号成分含有相位信息，其小波变换谱稳定性较差，不利于网络的正确识别。根据该神经网络对36例第一心音的分类结果表明，小波变换谱对于心音信号的快变成分具有很高的分辨能力，能对心音信号进行准确定位；ART-2神经网络具有好的稳定性、快速的识别能力和较强的抑制噪声的特性，并且是无监督的学习。
, 百拇医药
    3.2 神经网各类型的选择

    至今，人们已经提出了数十种神经网络模型，并以其独特的优越性在生物医学信号处理和生物医学信号模式识别中得到越来越多的应用。人工神经网络按其学习方式可分为有监督学习和无监督学习两类，其中常用的有BP网络、CPN网络、kohonen网络和ART网络，BP网络和CPN网络属于有监督学习，而kohonen网络和ART网络属于无监督学习，我们分别以BP网和ART网为例分析这两类网络的特性及其在心音信号识别与分类中的应用。

    目前应用最多的为以BP算法训练的多层前向网络，它以算法的系统性、完整性和应用的简便性而优于其它形式的网络，其强大分类功能特别适合于模式识别与分类的应用。BP网络具有以下特性：

    (1)BP网络适用于平稳环境，其客体间的关系以及相关的观察矢量具有统计平稳性，统计特征不随时间变化；

, 百拇医药     (2)BP网络的学习是在教师指导下的有监督的学习，它不能自学。网络的学习状态与工作状态分开的，不能边学习边工作；

    (3)学习过程中神经网络的所有权系数都需要调整，同时为防止出现振荡现象，学习的步幅必须相当小，使得学习速度缓慢，不利于对各种算法进行深入的研究；

    (4)在完成分类功能时，如果被区分的客体类别数超出了神经网络可以区分的最大极限，而学习仍按原方式进行，那就不能正确的学习结果。如果要避免出现这种情况而压缩客体的类别数，又使得神经网络的容量不能充分利用；

    (5)误差准则是固定的，不能随环境的变化进行相应的调整或改变；

    ART网络准则是以竞争学习和自稳定机制为原则的自适应谐振网络。其结构和算法相对较为复杂，实现起来比较困难。但是它的学习和工作阶段合二为一，可以随时适应新出现的类别，而且包含着神经生理学和心理学的内函。ART网络具有下述特性：
, http://www.100md.com
    (1)对输入观察矢量可以进行实时学习，且适应非平稳环境。直至记忆容量全部用完为止，不会出现新记忆破坏老记忆的错误；

    (2)通过子系统对已学习过的对象具有稳定的快速能力，通过定位子系统能迅速适应未学习的新对象；

    (3)具有自归一能力，根据某些特征在全体中占的比例，有时作为关键特征，有时视为噪声；

    (4)学习时不需要事先知道样本的结果，是无监督的学习，若对环境作出错误反映则迅速提高“警觉性”，快速识别对象；

    (5)容量不受输入通道限制，存储对象也不要求是正交的。

    对于频率组成复杂、随机性很强的心音信号，固然可以将BP网络直接用于心音信号的识别与分类，但是由于BP网络本身存在的局限性，使得它难以获得较好的结果。此外，对BP网络这种有监督的学习模式进行训练时，需要数量较大的训练样本，而且不同个体的心音存在较大的差异，使得心音信号的类型更为庞杂。因此，需要对大量的不同类型的心音进行研究，其工作量是巨大的。
, 百拇医药
    心音的神经网络模式识别与分类在一定程度上可以说是模仿医生的听诊及分析的机理，但是在某些方面它可能比医生的诊断更为准确，这样心音的类别就会不断增加。通常希望所有采用的系统具有开辟新类别的功能，或者在人工干预下，确定是否开辟新类别。我们知道，ART网络将学习、工作合二为一，在工作中可以随时发现新类别，从这一点来说，ART网络似乎更适合用于心音信号的识别与分类。

    在实际应用中，网络的数据输入形式和网络大小的确定是非常重要的，对于网络的输入层单元、输出层单元往往由待求的问题决定，因此确定网络大小也就是选取合适的稳层单元，虽然人们从理论上研究了如何确定隐层单元的数目^[8]，但是，即使已知隐层单元的最优数目，还是无法保证在此网络结构下学习得到正确的权值。因此，网络设计中通常利用实验和错误这种经验方法进行，网络学习时间可能很长，所以难以偿试大量网络和各种方法。对输入数据进行预处理能或者在代价函数中加入约束项，是减少网络大小和学习时间的常用方法。文献[7]中采用归一化方均根值误差作为门限，在网络的学习中也得到了较好的结果。
, 百拇医药
    4 其它识别方法

    按照维纳-辛格定理，功率谱的定义是以信号平稳为前提的。实际应用中常用的短时富里叶变换法或者参数模型法，均假设信号是短时平稳的。这种方法存在着一个不易克服的问题：时窗越窄频谱越宽，使得频率分辨率降低；反之也是如此。因此，用这些方法分析心音信号时，难以准确反映出心音的时变特性。近来，以Wigner分布及其改进型分布为代表的时频分析方法在一定程度上解决了短时富里叶变换存在的问题，并且具有高的时频分辨率及其它优良特性^[15]，采用时频分析方法研究心音信号，能够揭示其动态变化过程^[18]。文献[12]提出一种利用时频分布估计心脏瓣膜状况的方法。它们采用Choi-Williams分布作出45例正常和异常心音的时变谱，并根据时变谱中的9个特征对其进行分类，45例样本的分类中有44例与实际情况相吻合。实验结果表明在心音分类方面，时频分析方法明显优于传统的谱估计方法。

    Sava等^[16，17]设计了一个基于最小均方的自适应分类器，权系数采用Widron-Hoff算法确定，由改进的Prony方法求得心音的功率谱，以三个最高频率项对应的归一化幅值作为系统的输入。对26个病人(14人正常，12人异常)的分析结果表明，正确识别率为100%。
, 百拇医药
    最近有人尝试将泛系方法论用于心音信号的识别中^[13]，作出了正常心音及二尖瓣、主动脉瓣病变心音的对称点纹图(Symmetrized Dot Pattern,SDP)和点密度分布图(Dot Density Pattern,DDP)。研究结果表明，SDP和DDP相结合，可将局部可见的相关整合形成整体形象，使心音信号的微小差异得以放大，便于心音特征的识别。

    5 结束语

    在过去的几十年中，许多研究人员在心音信号识别与分类方面作了大量的工作，取得了不少有意义的成果。由于心音信号对心血管疾病诊断的重要作用以及分类中存在的许多困难，至今心音信号的识别与分类仍然是生物医学信号领域中一个重要的课题。为了科学准确地对心音信号进行分类，一方面要依靠新的更有效的信号处理技术和分类方法，另一方面应该建立一个心音数据库，以及公认的分析分类指标，从而为心脏和心血管系统疾病的无创诊断提供科学的依据。
, http://www.100md.com
    参考文献

    1 Joo TH, Mcclellan JH, Faole RA et al. Pole-zero modeling and classification of phonocardiograms. IEEE Trans BME,1983;30(2)∶110

    2 Durand LG, Blanchard M, Cloutier G et al. Comparison of pattern recognition methods for computer-assisted classification of spectra of heart sounds in patients with a porcine bioprosthetic valve implanted in the mitral position. IEEE Trans BME,1990;37(12)∶1121

, 百拇医药     3 Durand LG, Guo Z, Sabbah HN et al. Comparison of spectral techniques for computer-assisted classificantion of spectra of heart sounds in patients with porcine bioprosthetic valve. Med Biol Eng Comput,1993;31(5)∶229

    4 Durand LG, Langlois YE, Lanthier T et al. Spectral analysis and acoustic transmission of mitral and aortic valve closure sounds in dogs. Part 1:Modelling the heart/thorax acostic system. Med Biol Eng Comput,1990;28∶269

, 百拇医药     5 Akay M, Welkowitz W. Acoustical detection of coronary occlusions using neural networks. Biomed Eng,1993;15(11)∶469

    6 Akay M, Welkowitz W, Semmlow JL et al. Application of the ARMA method to acoustic detection of coronary artery disease. Med Biol Eng Comput,1991;29(6)∶365

    7 Guo Z, Durand LG, Clee H et al. Artificial neural networks in computer-assisted classification of heart sounds in patients with porcine bioprosthetic valves. Med Biol Eng Comput,1994;32(5)∶311
, http://www.100md.com
    8 Weigend AS. Generalization by weight-elimination with application to forecasting. Advances in Neural Informa-tion Processing Systems,1991;3∶875

    9 Barschodorff D, Ester S, Dorsel T et al. A new phonographic technique for congenital and acquired heart disease using neural networks. Biomed Technik,1990;35∶271

    10 吴延军，徐泾平，程敬之等.心音信号处理与识别.中国医疗器械杂志，1996；20(4)∶103

    11 Bement SL, Veeneman DE. Comments on pole-zero modeling and classification of phonocardiograms. IEEE Trans BME,1984;31(6)∶473
, 百拇医药
    12 Bentley PM, McDonnel JTE，Grant PM et al. Classification of native hearts valve sounds using the Choi-Williams time-frequency distribution. Proc IEEE EMBS 16th Annual International Conference,1995;2∶1186

    13 卢耘，粟载福，粟庆汉等.心音信号的泛图分析.中国生物医学工程学报，1996；15(3)∶208

    14 Akay M. Investigating the effect of vasodilator durgs on the turbulent sound caused by femoral artery stenosis using short-time fourier and wavelet transform methods. IEEE Trans BME,1994;41(10)∶921
, 百拇医药
    15 Cohen L. time-frequency distribution-a review. IEEE Proc,1989;77(7)∶941

    16 Sava HP, Bedi R, McDonnell JTE et al. Classification of carpentier-edwards bioprosthesis heart valves using an adaptive signal layer perceptron.Proc IEEE EMBS 16th Annual International Conference,1995;2∶1245

    17 Sava HP, Grant PM, McDonnell JTE et al. Spectral characterization and classification of carpentier-edwards heart valves implanted in the aortic position. IEEE Trans BME,1996;43(10)∶1046

    18 Wood JC, Barry DT. Time-frequency analysis of the first heard sound. IEEE Engineering in Medicine and Biology Magazine,1995;14(2)∶144

    (收稿：1998-03-03), 百拇医药

百拇医药网 http://www.100md.com/html/analecta/2003/08/31/73/738.htm