基于复杂性测度的帕金森症病人EEG分析
作者:陈仲永 伍文凯 童勤业 严筱刚
单位:浙江大学 生命科学与医学工程学系,杭州 310027
关键词:复杂性;EEG;帕金森症
生物医学工程学杂志990222 摘要 EEG代表了大脑神经元活动的一种电信号,它一直是人们分析和研究大脑活动和大脑功能状态的重要工具。我们利用了由Kolmogorov和徐京华定义的Kc复杂性和C1复杂性,对帕金森症患者和正常人的EEG时间序列作了分析和研究,根据400例的统计结果表明,复杂性能够区分这两者,我们认为这种方法可能作为诊断帕金森症的客观指标。
Analysis of Parkinson's EEG Based on the Complexity Measure
Chen Zhongyong Wu Wenkai Tong Qinye Yan Xiaogang
, 百拇医药
Department of Biomedical Engineering, Zhejiang University, Hangzhou 310027
Abstract EEG represents the electricy activity of neurons in human brain; it is of course repeatedly used for studying and analyzing the brain activity and the status of brain function. We analyzed the Parkinson's and normal persons' EEG, with the aid of Kc complexity and C1 complexity defined by Kolmogorov and Xujinhua respectively. The results of the analysis on the data from 200 patients and 200 normal persons indicate that the complexity of EEG can be regarded as a feature classifying the Parkinson's EEG and normal persons' EEG.
, 百拇医药
Key words Complexity EEG Parkinson's disease
1 概 述
脑电是大脑神经元突触后电位的综合,是大脑神经电活动产生的电场经容积导体传导后在头皮上的电位分布,脑电图反映了大脑组织的电活动和大脑的功能状态。如何从脑电信息中提取出可靠参数来反映大脑的功能状态一直是人们希望得到解决的问题。
自从Hans Berger发现并记录了脑电后,越来越多的研究者进行了这方面的研究,他们想揭开脑的处理信息过程和它的功能状态,但都没有取得突破性进展,这主要是因为人脑是一个强非线性系统,而他们用的基本上是线性的分析方法,如频谱等。最近非线性科学的发展为研究人脑提供了有力的工具。但目前主要用:
1.1 相关维数
它用嵌入空间的方法重构非线性系统,在此基础上再用相关维数分析方法,如文献[5]指出,这种方法不适合于人脑这种各向异性的空间扩展系统,实际上这种方法需要的数据量很大,要求脑电记录有较高的平稳性,而实际脑电的精确维数不能计算并且这种结果有可能综合了几个功能状态。
, http://www.100md.com
1.2 协同学方法
受协同学的启发,人们定义了大脑的动力学模型,但这些模型很难从生理和功能意义上解释,并且这种方法着重于刻画动力学系统的相位转移特性,而不提供在转移过程中系统的特性[5]。
我们采用复杂性方法来分析EEG时间序列,这种方法克服了上述方法需长时间数据等缺点,先叙述Kc复杂性和C1复杂性[2],然后将它们用来分析帕金森症病人的脑电,我们运用统计数学中的方法对计算出的各道复杂性结果进行了深入的分析,得出了一些可喜的结果,并同时指出了样本数容量的最低要求,和样本的最高误差率。
2 复杂性测度
2.1 Kolmogorov复杂性[1]
本世纪60年代,Kolmogorov这样定义了一个由“0”到“1”组成的序列的复杂性,能够产生这一序列的最短程序的bit数。这种复杂性可以称之为算法复杂性(Algorithm Complexity),当给定某一算法,对于不同的序列,将产生不同的程序长度,用它来衡量序列的复杂程度如何,但是这个定义却没有一般的算法,直到Lempel和Ziv给出了数学讨论及算法描述:
, 百拇医药
(1)假如我们有一数列(x1,x2,…,xn),首先求得这个数列的平均值,再把这个数列重构,大于平均值的x,令它们为1,小于平均值的x,令之为0,这样,我们从(x1,x2,…,xn)序列得到一个(0,1)序列;
(2)对这样的(0,1)序列中已形成的一串字符S=(s1,s2,…,sm)后再加一个或一串字sm+1,或(sm+1,sm+2,sm+3,…,sm+k)称之为Q,得到SQ,令SQv是一串字符SQ减去最后的一个字符,再看Q是否属于SQv字符串中已有的“字句”,如果已经有过,那么把这个字符加在后面称之 “复制”,如果没有出现过称之为“插入”,“插入”时用一个“.’把前后分开,下一步则把“.”前面的所有的字符看成S,再重复如上步骤,例如,序列0010的复杂度可以由下列步骤而得:
, 百拇医药
A. 第一个符号永是插入□0.
B. S=0,Q=0,SQ=00,SQv=0,Q属于字句,SQv□0.0
C. S=0,Q=01,SQ=001,SQv=00,Q不属于字句,SQv□0.01.
D. S=001,Q=0,SQ=0010,SQv=001,Q属于字句,SQv□0.01.0
这时,c(4)=3如符号列00000……应是最简单的,它的形式应是0.0000……,c(n)=2;符号列01010101……应是0.1.0101……c(n)=3;
(3)如上所述,得到用“.”分成段的字符串,分成了段的数目就定义为“复杂度”c(n);
(4)根据Lempel和Ziv的研究,对几乎所有的x属于[0,1]的c(n)都会趋向一个定值:
, http://www.100md.com
2.2 C1复杂性测度[2]
假定有一动力系统的时间序列[Si]Ni=1,而且N足够大,为了简单起见,令时间序列中的元素Si属于为“0”和“1”,因此长度为n的字有2n个可能的排列的子序列[Si]n.2ni=1,令Na(n)是在子序列中长度为n的字节数,那么就可定义长度为n的允许序列C1:
这个定义代表了序列的随机性,与Kc等价:对于完全随机序列,当n→∞,C1→1。
3 实验结果与分析
所用的脑电数据是由澳大利亚墨尔本健康中心提供,共有400人,200人已经由医生确诊为帕金森症,200人为正常人,每人有两种状态:睁眼,闭眼。记录导联采用国际脑电图标准,记录了32道EEG数据,分析计算时,我们仅用了8道(fp1,fp2,c3,c3,t3,t4,01,02)。
, 百拇医药
计算步骤:
(1)首先计算每个人每道EEG序列的复杂性测度,然后,将这8道的复杂性结果组成一8维向量,代表一个人的信息。
(2)统计分析
①样本的均值检验:需要检验条件H0∶μ1=μ2。当H0被接受时,说明区分这二类样本无意义,μ1,μ2为二类样本集的均值向量,在此基础上建立的判别函数效果肯定不好,由文献[4],我们定义了F统计量:
其中:
, http://www.100md.com
n1为类型一的样本数;n2为类型二的样本数;m为样本向量的维数。
F~F(m,n1+n2-m-1),表1列出了它的计算结果(对于C1)。
表1 F统计量结果
Table 1 F statistic measure Status
F Statistic
measure
F0.05(8,391)
Significant
difference(Y/N)
, 百拇医药
Eyes opened
25.293
1.0
Y
Eyes closed
25.425
1.0
Y
当F0.05(8,391),则条件H0被接受,否则被拒绝。
②判别分析:由上表得出,二类样本集有差别,在此基础上建立判别函数:我们采用了贝叶斯分类方法,假设样本Ωi服从N(μi,∑i),由文献[3]可得到判决函数:
, 百拇医药
其中:P(ωi)为类型Ωi的先验概率;μi为类型Ωi的平均向量;∑i为协方差矩阵,对于二类样本,考虑对数函数的单调性,由贝叶斯分类准则,可得到二类样本Ωi,Ωj的决策面方程:
实际计算时,由8道脑电的复杂性测度构成一特征向量,我们采用了“重代入法”判断结果如表2:
表2 判别结果
Table 2 The results of differentiation
Complexity C1
Complexity Kc
, 百拇医药
Eyes
opened(%)
Eyes
closed(%)
Eyes
opened(%)
Eyes
closed(%)
Normal
92.5
87
91
86.5
, 百拇医药
Patients
78.5
81.5
78.5
81.5
Aggregate
85.5
84.25
84.75
84
③样本容量:由于在进行病例统计时,判别函数实施的效果是否有意义,需要适当的样本容量,如对于二个样本,判对,判错各50%,显然不符合统计意义。因此,为了符合统计意义,需要一定的样本容量。另外,样本容量一定时,特征向量的维数和判决函数的性能有一定的关系。我们在实际中发现,不是维数越高越好,这是因为附加的信息不足以改进判决函数的性能,表3列出了样本容量和特征向量维数,样本集之间的距离三者之间的关系。表3 样本容量和特征向量维数
, 百拇医药
Table 3 The number of sample and the dimension of characteristic vector Dimension of
characteristic vector
Distance between
the sample sets
Needed number of
sample
2
1
9
2
, http://www.100md.com
8
3
7
10
1
35
2
27
3
25
当δ<1时,则大约需样本数为10 d,从这个意义上来说,本实验中的维数d=8,距离≈1.4,实际样本数=400,结果是符合统计理论的。
④误差率分析:用判别分析的方法来判断样品的归属是会犯错误的,我们希望越准确越好,因此,计算误判率上界(它大于或等于真实的误差率,反映了判决函数的性能)是很重要的,文献[3]指出:
, http://www.100md.com
计算结果如表4:
表4 误差率结果
Table 4 The results of error
Complexity C1
Complexity Kc
Eyes
opened(%)
Eyes
closed(%)
Eyes
opened(%)
, http://www.100md.com
Eyes
closed(%)
Upper limit
of error
23.58
23.58
23.27
23.58
实际上文献[3]指出重代入法给出的错误率是偏乐观的,它是错误率的下界,它大于或等于真实的误差率。从上表中,进一步得出用复杂性测度计算出的结果是能分别出正常人和帕金森症患者。
4 总 结
, 百拇医药 我们用复杂性测度的方法分析了400人的脑电数据,首先计算每道脑电记录的复杂性,然后,对其作了进一步的统计分析,误差分析和判别分析,结果表明:
(1)用复杂性测度方法分析帕金森症,有很好的效果,并且结果是符合医学统计观点的。
(2)用C1和Kc无论对病人和正常人都有明显的效果,可见复杂性是能够较好地描述脑电并可能在诊断帕金森症上给出量化指标。
(3)复杂性方法本身还有很多局限,不能对EEG本质作出完整的描述,如不能给出脑功能状态转变时,脑动力系统是如何改变,复杂性不能给出细微、深入的描述,而且对脑功能状态的研究还需要更多的实验。
参考文献
1 徐京华,吴祥宝.以复杂性测度刻画大脑皮层上的信息传输.中国科学(B),1994;24(1)∶57
, http://www.100md.com
2 徐京华.大脑皮层信息传输和精神分裂症.生物物理学报,1994;24(1)∶103
3 李金宗.模式识别导论.北京:高教出版社,1994∶103-245
4 P.A.拉亨布鲁克,李从珠译.判别分析.北京:群众出版社,1988∶1-33
5 Laurent P, Jacques M, Francisco JV et al. Entropy quantification of human brain spatio-temporal dynamics. physica D,1996; 96∶344
6 Wackerbbuer R. A Comparative Classification of Complexity Measure. Chaos Solitons&Fractals, 1994; 4(1)
收稿:1998-01-25, 百拇医药
单位:浙江大学 生命科学与医学工程学系,杭州 310027
关键词:复杂性;EEG;帕金森症
生物医学工程学杂志990222 摘要 EEG代表了大脑神经元活动的一种电信号,它一直是人们分析和研究大脑活动和大脑功能状态的重要工具。我们利用了由Kolmogorov和徐京华定义的Kc复杂性和C1复杂性,对帕金森症患者和正常人的EEG时间序列作了分析和研究,根据400例的统计结果表明,复杂性能够区分这两者,我们认为这种方法可能作为诊断帕金森症的客观指标。
Analysis of Parkinson's EEG Based on the Complexity Measure
Chen Zhongyong Wu Wenkai Tong Qinye Yan Xiaogang
, 百拇医药
Department of Biomedical Engineering, Zhejiang University, Hangzhou 310027
Abstract EEG represents the electricy activity of neurons in human brain; it is of course repeatedly used for studying and analyzing the brain activity and the status of brain function. We analyzed the Parkinson's and normal persons' EEG, with the aid of Kc complexity and C1 complexity defined by Kolmogorov and Xujinhua respectively. The results of the analysis on the data from 200 patients and 200 normal persons indicate that the complexity of EEG can be regarded as a feature classifying the Parkinson's EEG and normal persons' EEG.
, 百拇医药
Key words Complexity EEG Parkinson's disease
1 概 述
脑电是大脑神经元突触后电位的综合,是大脑神经电活动产生的电场经容积导体传导后在头皮上的电位分布,脑电图反映了大脑组织的电活动和大脑的功能状态。如何从脑电信息中提取出可靠参数来反映大脑的功能状态一直是人们希望得到解决的问题。
自从Hans Berger发现并记录了脑电后,越来越多的研究者进行了这方面的研究,他们想揭开脑的处理信息过程和它的功能状态,但都没有取得突破性进展,这主要是因为人脑是一个强非线性系统,而他们用的基本上是线性的分析方法,如频谱等。最近非线性科学的发展为研究人脑提供了有力的工具。但目前主要用:
1.1 相关维数
它用嵌入空间的方法重构非线性系统,在此基础上再用相关维数分析方法,如文献[5]指出,这种方法不适合于人脑这种各向异性的空间扩展系统,实际上这种方法需要的数据量很大,要求脑电记录有较高的平稳性,而实际脑电的精确维数不能计算并且这种结果有可能综合了几个功能状态。
, http://www.100md.com
1.2 协同学方法
受协同学的启发,人们定义了大脑的动力学模型,但这些模型很难从生理和功能意义上解释,并且这种方法着重于刻画动力学系统的相位转移特性,而不提供在转移过程中系统的特性[5]。
我们采用复杂性方法来分析EEG时间序列,这种方法克服了上述方法需长时间数据等缺点,先叙述Kc复杂性和C1复杂性[2],然后将它们用来分析帕金森症病人的脑电,我们运用统计数学中的方法对计算出的各道复杂性结果进行了深入的分析,得出了一些可喜的结果,并同时指出了样本数容量的最低要求,和样本的最高误差率。
2 复杂性测度
2.1 Kolmogorov复杂性[1]
本世纪60年代,Kolmogorov这样定义了一个由“0”到“1”组成的序列的复杂性,能够产生这一序列的最短程序的bit数。这种复杂性可以称之为算法复杂性(Algorithm Complexity),当给定某一算法,对于不同的序列,将产生不同的程序长度,用它来衡量序列的复杂程度如何,但是这个定义却没有一般的算法,直到Lempel和Ziv给出了数学讨论及算法描述:
, 百拇医药
(1)假如我们有一数列(x1,x2,…,xn),首先求得这个数列的平均值,再把这个数列重构,大于平均值的x,令它们为1,小于平均值的x,令之为0,这样,我们从(x1,x2,…,xn)序列得到一个(0,1)序列;
(2)对这样的(0,1)序列中已形成的一串字符S=(s1,s2,…,sm)后再加一个或一串字sm+1,或(sm+1,sm+2,sm+3,…,sm+k)称之为Q,得到SQ,令SQv是一串字符SQ减去最后的一个字符,再看Q是否属于SQv字符串中已有的“字句”,如果已经有过,那么把这个字符加在后面称之 “复制”,如果没有出现过称之为“插入”,“插入”时用一个“.’把前后分开,下一步则把“.”前面的所有的字符看成S,再重复如上步骤,例如,序列0010的复杂度可以由下列步骤而得:
, 百拇医药
A. 第一个符号永是插入□0.
B. S=0,Q=0,SQ=00,SQv=0,Q属于字句,SQv□0.0
C. S=0,Q=01,SQ=001,SQv=00,Q不属于字句,SQv□0.01.
D. S=001,Q=0,SQ=0010,SQv=001,Q属于字句,SQv□0.01.0
这时,c(4)=3如符号列00000……应是最简单的,它的形式应是0.0000……,c(n)=2;符号列01010101……应是0.1.0101……c(n)=3;
(3)如上所述,得到用“.”分成段的字符串,分成了段的数目就定义为“复杂度”c(n);
(4)根据Lempel和Ziv的研究,对几乎所有的x属于[0,1]的c(n)都会趋向一个定值:
, http://www.100md.com
2.2 C1复杂性测度[2]
假定有一动力系统的时间序列[Si]Ni=1,而且N足够大,为了简单起见,令时间序列中的元素Si属于为“0”和“1”,因此长度为n的字有2n个可能的排列的子序列[Si]n.2ni=1,令Na(n)是在子序列中长度为n的字节数,那么就可定义长度为n的允许序列C1:
这个定义代表了序列的随机性,与Kc等价:对于完全随机序列,当n→∞,C1→1。
3 实验结果与分析
所用的脑电数据是由澳大利亚墨尔本健康中心提供,共有400人,200人已经由医生确诊为帕金森症,200人为正常人,每人有两种状态:睁眼,闭眼。记录导联采用国际脑电图标准,记录了32道EEG数据,分析计算时,我们仅用了8道(fp1,fp2,c3,c3,t3,t4,01,02)。
, 百拇医药
计算步骤:
(1)首先计算每个人每道EEG序列的复杂性测度,然后,将这8道的复杂性结果组成一8维向量,代表一个人的信息。
(2)统计分析
①样本的均值检验:需要检验条件H0∶μ1=μ2。当H0被接受时,说明区分这二类样本无意义,μ1,μ2为二类样本集的均值向量,在此基础上建立的判别函数效果肯定不好,由文献[4],我们定义了F统计量:
其中:
, http://www.100md.com
n1为类型一的样本数;n2为类型二的样本数;m为样本向量的维数。
F~F(m,n1+n2-m-1),表1列出了它的计算结果(对于C1)。
表1 F统计量结果
Table 1 F statistic measure Status
F Statistic
measure
F0.05(8,391)
Significant
difference(Y/N)
, 百拇医药
Eyes opened
25.293
1.0
Y
Eyes closed
25.425
1.0
Y
当F
②判别分析:由上表得出,二类样本集有差别,在此基础上建立判别函数:我们采用了贝叶斯分类方法,假设样本Ωi服从N(μi,∑i),由文献[3]可得到判决函数:
, 百拇医药
其中:P(ωi)为类型Ωi的先验概率;μi为类型Ωi的平均向量;∑i为协方差矩阵,对于二类样本,考虑对数函数的单调性,由贝叶斯分类准则,可得到二类样本Ωi,Ωj的决策面方程:
实际计算时,由8道脑电的复杂性测度构成一特征向量,我们采用了“重代入法”判断结果如表2:
表2 判别结果
Table 2 The results of differentiation
Complexity C1
Complexity Kc
, 百拇医药
Eyes
opened(%)
Eyes
closed(%)
Eyes
opened(%)
Eyes
closed(%)
Normal
92.5
87
91
86.5
, 百拇医药
Patients
78.5
81.5
78.5
81.5
Aggregate
85.5
84.25
84.75
84
③样本容量:由于在进行病例统计时,判别函数实施的效果是否有意义,需要适当的样本容量,如对于二个样本,判对,判错各50%,显然不符合统计意义。因此,为了符合统计意义,需要一定的样本容量。另外,样本容量一定时,特征向量的维数和判决函数的性能有一定的关系。我们在实际中发现,不是维数越高越好,这是因为附加的信息不足以改进判决函数的性能,表3列出了样本容量和特征向量维数,样本集之间的距离三者之间的关系。表3 样本容量和特征向量维数
, 百拇医药
Table 3 The number of sample and the dimension of characteristic vector Dimension of
characteristic vector
Distance between
the sample sets
Needed number of
sample
2
1
9
2
, http://www.100md.com
8
3
7
10
1
35
2
27
3
25
当δ<1时,则大约需样本数为10 d,从这个意义上来说,本实验中的维数d=8,距离≈1.4,实际样本数=400,结果是符合统计理论的。
④误差率分析:用判别分析的方法来判断样品的归属是会犯错误的,我们希望越准确越好,因此,计算误判率上界(它大于或等于真实的误差率,反映了判决函数的性能)是很重要的,文献[3]指出:
, http://www.100md.com
计算结果如表4:
表4 误差率结果
Table 4 The results of error
Complexity C1
Complexity Kc
Eyes
opened(%)
Eyes
closed(%)
Eyes
opened(%)
, http://www.100md.com
Eyes
closed(%)
Upper limit
of error
23.58
23.58
23.27
23.58
实际上文献[3]指出重代入法给出的错误率是偏乐观的,它是错误率的下界,它大于或等于真实的误差率。从上表中,进一步得出用复杂性测度计算出的结果是能分别出正常人和帕金森症患者。
4 总 结
, 百拇医药 我们用复杂性测度的方法分析了400人的脑电数据,首先计算每道脑电记录的复杂性,然后,对其作了进一步的统计分析,误差分析和判别分析,结果表明:
(1)用复杂性测度方法分析帕金森症,有很好的效果,并且结果是符合医学统计观点的。
(2)用C1和Kc无论对病人和正常人都有明显的效果,可见复杂性是能够较好地描述脑电并可能在诊断帕金森症上给出量化指标。
(3)复杂性方法本身还有很多局限,不能对EEG本质作出完整的描述,如不能给出脑功能状态转变时,脑动力系统是如何改变,复杂性不能给出细微、深入的描述,而且对脑功能状态的研究还需要更多的实验。
参考文献
1 徐京华,吴祥宝.以复杂性测度刻画大脑皮层上的信息传输.中国科学(B),1994;24(1)∶57
, http://www.100md.com
2 徐京华.大脑皮层信息传输和精神分裂症.生物物理学报,1994;24(1)∶103
3 李金宗.模式识别导论.北京:高教出版社,1994∶103-245
4 P.A.拉亨布鲁克,李从珠译.判别分析.北京:群众出版社,1988∶1-33
5 Laurent P, Jacques M, Francisco JV et al. Entropy quantification of human brain spatio-temporal dynamics. physica D,1996; 96∶344
6 Wackerbbuer R. A Comparative Classification of Complexity Measure. Chaos Solitons&Fractals, 1994; 4(1)
收稿:1998-01-25, 百拇医药