诊断特异性的标准化计算方法
大庆油田总医院 黑龙江省大庆市 163001
项目负责人 李慧梅大庆油田总医院 黑龙江省大庆市 163001
收稿日期 1999-04-28 接收日期 1999-06-10
Subject headings diagnosis specificity; standardization calculation
主题词 诊断特异性;标准化计算
, http://www.100md.com 1 特异性及其经典计算法
特异性(specificity, SP)是指某个项目在某疾病以外的人群中的真阴性率或百分比. 世界上经典法计算SP及其他诊断时首先将有关统计数据列在表1中,然后进行计算.
表1 某项目在试验组与对照组中“+”“-”分布频数
, 百拇医药
TP=真阳性 FN=假阴性 FP=假阳性 TN=真阴性SP%=TN/(FP+TN)*100%——(1)
由于某项目不仅在患该病的试验组中有一定的阳性率,在非患该病的其他疾病乃至正常人群中也可能有一定的假阳性率,所以表1中的对照组包括了若干亚组,它们是若干种非患该病的其他疾病类和正常人,以符号A,B,C…N代表之,将式(1)改写成:
SP%=A, B, C…N各亚组总真阴性数/A,B,C…N各亚组总数×100%——(2)
特异性的经典计算法的缺陷:我们在阅读文献过程中发现某项目对某疾病的诊断特异性,在不同作者中有较大差异. 由于患该病以外的其他疾病假阳性率不同,显然不同的观察对象可有不同,但观察对象均为A,B,C…N亚组的文献中,作者之间的SP的悬殊差异,引起了我们的注意. 分析其原因有:①各学者间观察的A,B,C…N亚组比例数不同. ②抽样误差,③非患该病的其他疾病类可因病程及人群其他状况的差异,④实验误差. 我们认为第1条原因是主要的,因为A,B,C…N各亚组间假阳性率差异较大,而各家观察各亚组比例数的不同,这样合计的对照组的真阴性总数及观察总数必然有差异,致使计算式(2)的分子分母变差较大,直接导致计算出的SP有较大差异. 为证明这一观点,我们模拟了实验,设计了三次抽样同为A,B,C…N亚组的对照组,为了齐同可比,设定各亚组中每个亚组观察对象的假阳性率是相同的,设三次均分别从同一A,B,C…N正体中抽样,并假定不存在抽样误差,三次抽样的区别仅仅是各亚组抽样比例数不同. 抽样及结果分别见表2,表3和表4.
, 百拇医药
表2 第一次抽样结果
SP1%=213/230*100%=92.61%.
表3 第二次抽样结果
, 百拇医药
SP2%=159/200*100%=79.50%.
表4 第三次抽样结果
SP3%=221/300*100%=73.66%.
, 百拇医药
可见,三次抽样中仅由于不同的A,B,C…N例数组合,出现了SP的悬殊差异.
2 特异性的标准化计算方法
对照组A,B,C…N各亚组间由于每次所取比例数不同而产生的各次抽样间SP的悬殊差异已如上述,为解决这一问题,我们经过多年探讨,建立了SP的标准化(standardization)计算法. 所谓标准化,就是把对照组的A,B,C…N各亚组的阳性数和阴性数标准化为(换算为)同一观察基数100例时各自的标化阳性数和标化阴性数,然后计算SP. 由数据标准化后计算出的SP1,我们称之为标化特异性(SSP)以与已往所用SP相区别. 举例:将表2数据标准化后,得表5结果.
表5 表2数据标准化后的结果
, 百拇医药
SSP%=318/400*100%=79.50%.
将表2,3,4的数据标准化后所得结果,都与表5相同,即SSP%都为79.50. 也就是说,从A,B,C…N各亚组中,各次抽样的比例数虽然不同,经过标准化后计算所得SSP是相同的,而用经典计算法计算所得SP,在各次间相差悬殊,这就证明了标准化后计算的结果是最正确的. 当然,以上实验与推论是在除A,B,C…N间比例数不同之外,假定其他条件齐同可比的前提下所得到的结果,此即为本课题之所求.
至于引起SP差异的抽样误差,可以通过合理地实验设计使之降低. 根据两项分布的概率密度函数:
f(x)={n!/x!*(n-x)!〕}*Px*(1-p)(n-x)——(3)
和Poisson分布的概率密度函数:f(x)=ux* e(-μ)/x!
, http://www.100md.com
我们知道,随着抽样样本量的增加,抽样误差逐渐减小,但医学研究的特殊性,使我们不可能也无必要采用过大的样本量,通常各家所采用的各亚组30例~50例是可行的,而过小样本会产生较大抽样误差;实验误差的影响不是本课题讨论的范围,比较起来不会太大;对照组中各亚组可因病程及人群的其他状况的差异是客观存在的,通过合理地实验设计,只要各家所设对照组A,B,C…N亚组相同,数据标准化后计算出的SP,应该是十分接近的,这有利于各家对某项目诊断某疾病的SP取得基本一致的认同. 诊断评价指标有:敏感性(sensitivity)、特异性(specificity)、假阳性率(false positive)、假阴性率(False negative)、约尔登指数据(Yorden's Index)、诊断效率(efficiency of A Test)等,计算他们时都要依据表1的统计数据. 为计算SP已将对照组各数据标准化,因此,计算其他指标时,则应将表1对照组的数据依次改为:各亚组标准化阴性总数、标准化阴性总数和标准化总计的亚组各平均值(各数据被亚组组数所除),并把试验组亦同样标准化,然后按常法计算其他诊断评价指标.
标准化方法计算的SP提高正确性之后,直接提高了某项目对某疾病诊断的SP正确评价,同时其他有关指标也由于SP的改正而提高了正确性,有利于更客观、更真实、更正确地评价某项目对某疾病的诊断评价效果., http://www.100md.com(李慧梅 李海华 房振环 李向岩)
项目负责人 李慧梅大庆油田总医院 黑龙江省大庆市 163001
收稿日期 1999-04-28 接收日期 1999-06-10
Subject headings diagnosis specificity; standardization calculation
主题词 诊断特异性;标准化计算
, http://www.100md.com 1 特异性及其经典计算法
特异性(specificity, SP)是指某个项目在某疾病以外的人群中的真阴性率或百分比. 世界上经典法计算SP及其他诊断时首先将有关统计数据列在表1中,然后进行计算.
表1 某项目在试验组与对照组中“+”“-”分布频数
组别 | 阳性数 | 阴性数 | 合计 |
试验组(患该病) | TP | FN | TP+FN |
对照组(非患该病) | FP | TN | FP+TN |
合计 | TP+FP | FN+TN | TP+FN+FP+TN |
, 百拇医药
TP=真阳性 FN=假阴性 FP=假阳性 TN=真阴性SP%=TN/(FP+TN)*100%——(1)
由于某项目不仅在患该病的试验组中有一定的阳性率,在非患该病的其他疾病乃至正常人群中也可能有一定的假阳性率,所以表1中的对照组包括了若干亚组,它们是若干种非患该病的其他疾病类和正常人,以符号A,B,C…N代表之,将式(1)改写成:
SP%=A, B, C…N各亚组总真阴性数/A,B,C…N各亚组总数×100%——(2)
特异性的经典计算法的缺陷:我们在阅读文献过程中发现某项目对某疾病的诊断特异性,在不同作者中有较大差异. 由于患该病以外的其他疾病假阳性率不同,显然不同的观察对象可有不同,但观察对象均为A,B,C…N亚组的文献中,作者之间的SP的悬殊差异,引起了我们的注意. 分析其原因有:①各学者间观察的A,B,C…N亚组比例数不同. ②抽样误差,③非患该病的其他疾病类可因病程及人群其他状况的差异,④实验误差. 我们认为第1条原因是主要的,因为A,B,C…N各亚组间假阳性率差异较大,而各家观察各亚组比例数的不同,这样合计的对照组的真阴性总数及观察总数必然有差异,致使计算式(2)的分子分母变差较大,直接导致计算出的SP有较大差异. 为证明这一观点,我们模拟了实验,设计了三次抽样同为A,B,C…N亚组的对照组,为了齐同可比,设定各亚组中每个亚组观察对象的假阳性率是相同的,设三次均分别从同一A,B,C…N正体中抽样,并假定不存在抽样误差,三次抽样的区别仅仅是各亚组抽样比例数不同. 抽样及结果分别见表2,表3和表4.
, 百拇医药
表2 第一次抽样结果
项目 | 观察数 | 阳性数 | 阴性数 | 假阳性率 |
A | 5 | 2 | 3 | 0.40 |
B | 25 | 9 | 16 | 0.36 |
C | 100 | 4 | 96 | 0.04 |
N | 100 | 2 | 98 | 0.02 |
合计 | 230 | 17 | 213 |
SP1%=213/230*100%=92.61%.
表3 第二次抽样结果
项目 | 观察数 | 阳性数 | 阴性数 | 假阳性率 |
A | 50 | 20 | 30 | 0.40 |
B | 50 | 18 | 32 | 0.36 |
C | 50 | 2 | 48 | 0.04 |
N | 50 | 1 | 19 | 0.02 |
合计 | 200 | 41 | 159 |
, 百拇医药
SP2%=159/200*100%=79.50%.
表4 第三次抽样结果
项目 | 观察数 | 阳性数 | 阴性数 | 假阳性率 |
A | 100 | 40 | 60 | 0.40 |
B | 100 | 36 | 64 | 0.36 |
C | 50 | 2 | 48 | 0.04 |
N | 50 | 1 | 49 | 0.02 |
合计 | 300 | 79 | 221 |
SP3%=221/300*100%=73.66%.
, 百拇医药
可见,三次抽样中仅由于不同的A,B,C…N例数组合,出现了SP的悬殊差异.
2 特异性的标准化计算方法
对照组A,B,C…N各亚组间由于每次所取比例数不同而产生的各次抽样间SP的悬殊差异已如上述,为解决这一问题,我们经过多年探讨,建立了SP的标准化(standardization)计算法. 所谓标准化,就是把对照组的A,B,C…N各亚组的阳性数和阴性数标准化为(换算为)同一观察基数100例时各自的标化阳性数和标化阴性数,然后计算SP. 由数据标准化后计算出的SP1,我们称之为标化特异性(SSP)以与已往所用SP相区别. 举例:将表2数据标准化后,得表5结果.
表5 表2数据标准化后的结果
项目 | 标准化阳性数 | 标准化阴性数 | 合计 | 假阳性率 |
A | 40 | 60 | 100 | 0.40 |
B | 36 | 64 | 100 | 0.36 |
C | 4 | 96 | 100 | 0.04 |
N | 2 | 98 | 100 | 0.02 |
合计 | 82 | 318 | 100 |
, 百拇医药
SSP%=318/400*100%=79.50%.
将表2,3,4的数据标准化后所得结果,都与表5相同,即SSP%都为79.50. 也就是说,从A,B,C…N各亚组中,各次抽样的比例数虽然不同,经过标准化后计算所得SSP是相同的,而用经典计算法计算所得SP,在各次间相差悬殊,这就证明了标准化后计算的结果是最正确的. 当然,以上实验与推论是在除A,B,C…N间比例数不同之外,假定其他条件齐同可比的前提下所得到的结果,此即为本课题之所求.
至于引起SP差异的抽样误差,可以通过合理地实验设计使之降低. 根据两项分布的概率密度函数:
f(x)={n!/x!*(n-x)!〕}*Px*(1-p)(n-x)——(3)
和Poisson分布的概率密度函数:f(x)=ux* e(-μ)/x!
, http://www.100md.com
我们知道,随着抽样样本量的增加,抽样误差逐渐减小,但医学研究的特殊性,使我们不可能也无必要采用过大的样本量,通常各家所采用的各亚组30例~50例是可行的,而过小样本会产生较大抽样误差;实验误差的影响不是本课题讨论的范围,比较起来不会太大;对照组中各亚组可因病程及人群的其他状况的差异是客观存在的,通过合理地实验设计,只要各家所设对照组A,B,C…N亚组相同,数据标准化后计算出的SP,应该是十分接近的,这有利于各家对某项目诊断某疾病的SP取得基本一致的认同. 诊断评价指标有:敏感性(sensitivity)、特异性(specificity)、假阳性率(false positive)、假阴性率(False negative)、约尔登指数据(Yorden's Index)、诊断效率(efficiency of A Test)等,计算他们时都要依据表1的统计数据. 为计算SP已将对照组各数据标准化,因此,计算其他指标时,则应将表1对照组的数据依次改为:各亚组标准化阴性总数、标准化阴性总数和标准化总计的亚组各平均值(各数据被亚组组数所除),并把试验组亦同样标准化,然后按常法计算其他诊断评价指标.
标准化方法计算的SP提高正确性之后,直接提高了某项目对某疾病诊断的SP正确评价,同时其他有关指标也由于SP的改正而提高了正确性,有利于更客观、更真实、更正确地评价某项目对某疾病的诊断评价效果., http://www.100md.com(李慧梅 李海华 房振环 李向岩)