多信息融合的彩色细胞图像分割方法
作者:李斌 马东 曹培杰 程敬之
单位:李斌(第四军医大学生物医学工程系 西安 110032);马东 曹培杰 程敬之(西安交通大学生物医学工程系 西安 710049)
关键词:图像分割;彩色图像;数学形态学
北京生物医学工程000106 摘 要 显微图像定量分析已广泛用于病理诊断、病理管理系统、癌变分级分类等多方面的医学研究领域。细胞区分割提取是一个重要技术,直接关系诊断的可靠性。本文就从病理切片的彩色图像中提取细胞核的有关方法作了研究,提出了有效的分割方法和策略。该方法以数学形态学为主要工具,可以利用细胞的多个特征(灰度、梯度、彩色、纹理等)较好地解决了病理显微图像背景复杂、光照不均及粘连团聚现象等因素给分割带来的困难。
A Segmentation of Color Cell Image of Multi-Information
, 百拇医药
Ma Dong
(Department of Biomedical Engineering,Xi′an Jiaotong University, Xi′an 710049)
Cao Peijie
(Department of Biomedical Engineering,Xi′an Jiaotong University, Xi′an 710049)
Li Bin
(Department of Biomedical Engineering, Fourth Military Medical University, Xi′an 710032)
Cheng Jingzhi
, 百拇医药
(Department of Biomedical Engineering,Xi′an Jiaotong University, Xi′an 710049)
Abstract
An image segmentation processing for complicated color cell images is described. The mthod is based on a mathematical morphological region growing algorithm that makes use of complex features of a cell: grey level, gradients, color, and texture features. The problems and difficulty that the background of pathological microimages are complicated, illumination is not homogeneous, and there are adhesion and clustering, which make segmentation of the images difficult, can be dealt with in a better way.
, 百拇医药
Key words:Image segmentation; Color image; Mathematical morphology; Color space transform
0 引 言
目前,图像分析系统(IAS)已成为细胞学和组织学定量分析研究的有力工具。目前已用于血液白细胞自动分类、肺癌、胃癌等肿瘤细胞的识别、癌前病变的分级、细胞计数、纹理分析、病理图像检索与管理等许多方面,不仅减轻了人工分析的劳动,还提供了客观、定量的结果。要得到好的分类、分析效果或较高的识别率,要获得精确定量化特征参数,依赖于准确、快速并具可重复性的分割技术,换句话说,分割处理是IAS中的关键环节。
以往的IAS因客观限制,一般仅对灰度图像处理[1]。对于细胞组织,主要通过染色技术观察不同物质。而成像系统转化为灰度图,丧失了重要的彩色信息,使一些细节上的差别很难区分。另外,从已有的报道看,大多数IAS采用自动或交互式阈值技术以提高处理速度,而单靠这一技术很难有可靠的分割结果。随着近几年低成本、高性能的CCD摄像机及计算机的出现,不仅可以建立真彩色图像处理系统,而且使用较复杂的算法处理大数据量图像已不太花费时间。
, 百拇医药
本文在真彩色IAS上开发了从显微图像中分割细胞(核)的方法,利用了细胞图像的彩色信息、亮度信息、边缘梯度信息等多种特征,通过将各信息进行加权组合实现改进的水坝分割算法,得到了满意的分割效果。
1 显微图像分割方法分析
显微图像指将组织、细胞制成染色切片或涂片通过显微镜观察到的图像,可以分成许多种类。本文主要以细胞图像为研究对象。一幅染色显微图像十分复杂:细胞核染色深,但边界因染色扩散而与胞浆、背景存在色交叉区且核内物质分布不均;细胞浆染色浅,无固定形状,有泡孔;背景无染色,但可能因光照不均而使亮度分布不均,还含一些杂质、污点。另外,采用复染技术,阳性、阴性细胞呈不同颜色。
图像分割方法主要分为阈值法、边缘检测法、聚类分割法、区域生长法等。彩色图像阈值法是灰度图像阈值法的扩展,可以改善灰度图像的分割精度。交互式方法引起人为偏差,自动方法要基于图像中同类区域色差较小而不同区域间色差较大这样的假设,对实际细胞图像显然不太适合。不仅细胞与背景存在颜色交叉区,核内还存在较大颗粒(纹理),使内部色分布不均匀。聚类法从某个角度看类似阈值法,所分的类别空间映射到图像空间中可能存在目标不连续或不连通情况。但聚类法因建立了多维持征空间,可以利用多种特征,对大多数情况分割效果较好。可惜好的聚类算法参数设置多且运算量太大。使用彩色边缘检测方法的难点是边界的连续性,如何合并各边缘段成为一个闭合域是较难的任务,一般采用启发式方法连接。但对于细节多的图像就更难了。基于区域的方法利用彩色相似性、空间连续性及边界对比度等决定区域的生长、合并或分裂,该方法可能因反复迭代而花费时间,种子点的位置也影响结果。
, 百拇医药
实际上,对于细胞图像的复杂情况,只能采取混合使用几种分割方法的策略,既提高分割精度,又减小难度和运算量。由上分析,我们认为对细胞图像的分割应在仔细研究处理景象的前提,按粗分—细分—修正三个阶段的分割策略。粗分包括预处理,确定目标范围或提取目标子集,细分过程将目标范围缩小或扩大目标子集直到分割出精细的目标区域,最后可通过人机交互方式剔除局部错误,修正偏差。
2 彩色空间变换和数学形态学
2.1 彩色空间变换
彩色图像由彩色CCD摄像机获得的由R、G、B三基色数据组成。大部分情况下,可以直接在RGB彩色空间处理图像,但对于分割目标可能在三维空间形成混叠的情况,有必要对彩色数据作变换,映射到其它彩色空间中(可以是一维的或二维的),得到较好的分离效果。
采用K-L变换可以得到一组正交特征向量,而主向量代表了大部分彩色信息。虽然这种变换是最优的,但求特征矩阵的运算量太大。Ohta等[2]经过大量实验得出有效特征集(I1,I′ 2,I′ 3)证明接近K-L变换的结果。
, 百拇医药
其它一些彩色空间如Lab空间,HSI空间,YUV空间等反映了不同的彩色分布,对于特定的彩色细胞图像,可能某种空间很适合分割,但需累试确定。
2.2 数学形态学
数学形态学提供的算法很适合对图像作形态处理,可以提取重要的形状特征[3]。腐蚀、膨胀、开和闭运算是数学形态学的基本运算。用开运算处理图像,可以剔除结构元的细节,使边界平滑,消除尖峰、凸缘、切断狭细连接。用闭运算同样平滑边界,并填充小孔,消除凹沟等。
测地形态学是数学形态学的一个分支。水坝(Watershed)分割方法将测地理论的集合运算推广到灰度图像领域[4]。其基本思想是:把灰度图像看作一种地理表面,灰度值对应表面的高低,因而地理表面存在许多峰、谷、盆地、高地等。如图1所示是两个相邻盆地,从盆地底部有泉水涌出,首先涌到较低的盆地,而后涌到较高盆地,称淹没过程。当两个盆地中的水即将会合时,建立一道水坝隔开,称水坝线。对整个地理表面实施淹没就会分割出许多区域。
, 百拇医药
使用水坝算法时,一般先对灰度图作梯度变换,则高梯度的边界对应水坝线。在实施水坝算法时,为克服过度分割,不是在所有盆地间建立水坝,而是从预先选好的标记盆地开始淹没,只在相邻标记的盆地间建立水坝,因而可分割出有意义的区域。
在水坝分割算法中,采用了多级队列的数据结构存贮待处理象素。一个象素按它的灰度(或梯度)值的高低送入相应排队级别的队列中。因为淹没过程从最低的盆地开始,所以灰度值越小优先级越高。需处理的象素首先从优先级高的队列中取出,当高级别队列为空时,再处理下一级队列中的象素,因而模拟了淹没过程。可以看出,水坝算法是边缘检测和类似区域生长过程的混合方法。
图1 水坝分割方法的二维剖面图示
3 分割算法
3.1 粗分阶段
, 百拇医药
这一步骤对原始彩色图像作预处理,并依水坝分割算法需要,将代表各核区的细胞核标记及背景标记提取出来。
首先分别对R、G、B三个分量作中值滤波,滤除各分量中引入的随机噪声。按彩色模型定义,从RGB分量中求出亮度图像Ⅰ,并使Ⅰ的灰度范围在0~255间,将背景定义为低亮度,细胞核等为高亮度。对亮度图像使用开运算滤波,结构元取5×5到9×9大小的尺寸(对256×256分辨率的图像)以除去图像中的小的非核物质。
其次,提取标记区。经过滤波后的亮度图像在大部分情况下,细胞核与背景已具有较好的对比度,采用自动阈值法可提取出各核区的子区域。但对于较复杂的情况仍需由人工交互方式标记细胞核。背景区是核区关于整个图像集合的补集。由于核标记区是实际核区的子集,对标记区作若干次膨胀,次数由预实验确定,使膨胀区域大于实际核区,再求补即得到代表背景区的标记区。同样,对于较复杂的情况也需由人工交互方式方法。
最后对已提取的核标记区和背景标记区分别赋予唯一标号(1,2,…,n),未标记区赋予标号0,成为水坝分割算法的初始标记区。
, 百拇医药
3.2 多特征加权组合的水坝分割算法
对于经典的水坝分割算法,利用灰度图像的梯度信息,即在梯度高的部分建立水坝,因而对应得到图像边缘。但有时梯度信息会受到干扰,例如核标记落在纹理区内,会将高纹理边缘形成水坝,造成分割错误。为此,我们将细胞核的多个特征融合起来。利用各特征值加权组合方式形成一个新的图像代替原算法中的梯度图。这些特征可以是:①亮度信息,反映各目标及背景的明暗程度②梯度信息,反映细胞核的边界特征;③彩色信息,反映核内彩色的局部特征相似性④纹理信息,反映核内的纹理匀一而边界纹理突变的特征。
(1)局部彩色分布相似性的组合分量 首先将RGB彩色空间变换到(I1,I′2,I′3)空间。为简化计算,只使用I1、I′2两个主要分量。
, http://www.100md.com
在水坝算法初始化时,分别求出I1、I′2分量在各标记区(核区和背景)内的均值M1(i)、M2(i)和方差σ1(i)、σ2(i),i=1,2,…,n为各标记区标号。在算法中,设P(x,y)点为待入队的一点,它的邻点已标记为第k号。以I1分量为例,则有level1=|I1(x,y)-M1(k)|,反映P(x,y)点在I1分量上与第k号标记区的相近程度,level1越小,一致性越好。为使组合分量有可比性,对level1作如下归一化处理。由于level1的值集中在0~2σ1间,作分段线性化到0~149。
, 百拇医药
同理可定义L2,表示P(x,y)点在I′2分量上与第k号标记区的一致性。
(2)梯度组合分量 用形态梯度算子可求得亮度图Ⅰ的梯度,表示为
ES=min{EG,DG}
其中
为结构元,取3×3平面结构元,
分别是腐蚀和膨胀运算。
显然ES (I) 大的图像点往往对应边界。同样也对ES (I) 作归一化处理到0~149。
(3)线性组合 将以上各特征进行加权组合形成用于水坝算法的新图N,表示为:
, 百拇医药
N=w1×ES+w2×L1+w3×L2
其中,w1+w2+w3=1
图像N与经典水坝算法中的梯度图有类似之处,在于:N值小对应灰度变化小,色彩相似;N值大对应存在灰度变化、色彩变化的边界。
对于加权系数w1,w2和w3的取值得由所处理的显微图像各特征的性质而定。如果梯度信息对分割结果贡献大,则取w1大些;如果核区与胞浆、背景的颜色有较大差异,或核区中含较多纹理,则取w1小些而w2、w3取大些。具体取多大权值,应通过实验样本得到。
, 百拇医药
3.3 算法步骤
综上所述,细分割过程可按以下步骤实现:①提取细胞核、背景的标记区,分别给予唯一标号i=1,2,…n,未标记区为0,形成图像M;②初始化各优先级队列为空(共150级);求梯度图ES;求各标记区的彩色统计参数L1、L2;③扫描标记区边界各点的邻域,当有未标记点即M(x,y)=0时,计算该点的N值,并按其大小将该点入队;④从最高优先级别非空队列开始,从中取出一点P,扫描其邻域,如果只有一个邻点已标记为k,则给P点赋值k,并使k号标记区域生长一点(这时要修正该标记区的彩色统计参数);如果有两个已标记的邻点,认为P点为边界点;⑤对于P点的其它邻点,如果有未标记点,计算该点的N值,并按N值大小放入相应优先级别的队中;⑥当所有级别的队列均为空,表示全图像点已处理完毕,即每一点都被分配到各标记区域中或定为边界点。否则返回到第4步继续处理。
3.4 分割结果修正
, http://www.100md.com
经过水坝算法分割后的区域基本已区分出各细胞核得到准确的核边界。但对于多核团聚情况,如果被标记为一个标记区,只能分割出该团聚区的外边界。要将内部各核分离,须看团聚的可分离性了。对于团聚、重叠不严重的情况,可重新作标记分离该区各核[5]。
4 实验结果
采用文中的分割算法,对18例细胞图像作了分割实验,其中12例HE染色血液细胞,8例巴氏染色宫颈脱落细胞,共约130个各类细胞。
图2(a)是一幅血液细胞彩色图像的灰度图。很明显有5个较大的白细胞,其核呈暗红色,胞浆呈浅紫色。周围有若干较小的浅综色红细胞。下方偏右是两块黑色杂质。
图2(b)是代表白细胞核的标记区。注意到用直方图自动分割法分离了背景、细胞浆、红细胞,但两块杂质暂未消除,并且没有将中间3个核分别标记。
, 百拇医药
图2(c)是对亮度图像做形态梯度运算的结果,反映了原图的梯度信息。
图2(d)是仅利用梯度信息分割图像,由于细胞浆边界与背景间有较大的梯度,结果我们得到了细胞浆的边界。图2(e)考虑到彩色信息,用本文算法,分别取加权系数为w1=0.6,w2=0.15,w3=0.25,得到了细胞核的边界。最后在修正阶段,进一步分离开3个相粘连的核(图2(f))。
图2 多特征融合的水坝分割结果
5 结 论
通过对显微图像的分析,本文提出了综合多种图像信息的分割策略和算法。实验结果表明,80%以上的细胞被正确分割出核边界,少数背景复杂的细胞及团聚细胞核经过适当修正可分割出满意的结果。对于错分的区域(如图2(f)中的杂质),在进一步的图像分析或模式识别中,可以利用形态特征或彩色特征等加以剔除。
, 百拇医药
此方法除了分割效果较好,另一个优点是,不仅划出了各区域的边界,而且区域内部各象素均已赋标号值,各区域的彩色特征也已得到(彩色分量均值、方差),为进一步的特征分析提供了有用数据,减少了特征提取的运算量。
此分割方法在一些方面仍需深入探讨。首先是关于加权系数的确定,作者考虑用样本统计方法给各系数一定的取值范围。其次是纹理信息的利用,可以观察到许多细胞结构具有较强的纹理特征,尤其是核异质细胞和癌细胞,对这类细胞的分割宜融入纹理信息,作者正寻求一种反映纹理均一性的计算量又小的纹理判据。另外,采用何种彩色空间能更好地分离多个目标和背景,目前暂使用累试的办法。
作者简介:马东(1967—),男,西安交通大学博士研究生,讲师。
6 参考文献
[1] Chan KL. Quantitative characterization of electron micrograph image using fractal feature. IEEE Trans BME, 1995,42(10):1033-1037
, http://www.100md.com
[2] Ohta Y, Kanade T, Sakai T. Color information for region segmentation. CGIP, 1980, 13(3):222
[3] Serra J. An introduction to mathematical morphology, CVGIP, 1986; 35:283-305
[4] Vincent L, Soille P. Watersheds in digital spaces: an efficient algorithm based on immersion simulations. IEEE Trans. PAMI, 1991;13(6):583-598
[5] 马东,曹培杰等.分割重叠细胞核的方法及比较研究.北京生物医学工程,1999;18(3):141-146
(1998-12-28收稿,1999-06-02修回), 百拇医药
单位:李斌(第四军医大学生物医学工程系 西安 110032);马东 曹培杰 程敬之(西安交通大学生物医学工程系 西安 710049)
关键词:图像分割;彩色图像;数学形态学
北京生物医学工程000106 摘 要 显微图像定量分析已广泛用于病理诊断、病理管理系统、癌变分级分类等多方面的医学研究领域。细胞区分割提取是一个重要技术,直接关系诊断的可靠性。本文就从病理切片的彩色图像中提取细胞核的有关方法作了研究,提出了有效的分割方法和策略。该方法以数学形态学为主要工具,可以利用细胞的多个特征(灰度、梯度、彩色、纹理等)较好地解决了病理显微图像背景复杂、光照不均及粘连团聚现象等因素给分割带来的困难。
A Segmentation of Color Cell Image of Multi-Information
, 百拇医药
Ma Dong
(Department of Biomedical Engineering,Xi′an Jiaotong University, Xi′an 710049)
Cao Peijie
(Department of Biomedical Engineering,Xi′an Jiaotong University, Xi′an 710049)
Li Bin
(Department of Biomedical Engineering, Fourth Military Medical University, Xi′an 710032)
Cheng Jingzhi
, 百拇医药
(Department of Biomedical Engineering,Xi′an Jiaotong University, Xi′an 710049)
Abstract
An image segmentation processing for complicated color cell images is described. The mthod is based on a mathematical morphological region growing algorithm that makes use of complex features of a cell: grey level, gradients, color, and texture features. The problems and difficulty that the background of pathological microimages are complicated, illumination is not homogeneous, and there are adhesion and clustering, which make segmentation of the images difficult, can be dealt with in a better way.
, 百拇医药
Key words:Image segmentation; Color image; Mathematical morphology; Color space transform
0 引 言
目前,图像分析系统(IAS)已成为细胞学和组织学定量分析研究的有力工具。目前已用于血液白细胞自动分类、肺癌、胃癌等肿瘤细胞的识别、癌前病变的分级、细胞计数、纹理分析、病理图像检索与管理等许多方面,不仅减轻了人工分析的劳动,还提供了客观、定量的结果。要得到好的分类、分析效果或较高的识别率,要获得精确定量化特征参数,依赖于准确、快速并具可重复性的分割技术,换句话说,分割处理是IAS中的关键环节。
以往的IAS因客观限制,一般仅对灰度图像处理[1]。对于细胞组织,主要通过染色技术观察不同物质。而成像系统转化为灰度图,丧失了重要的彩色信息,使一些细节上的差别很难区分。另外,从已有的报道看,大多数IAS采用自动或交互式阈值技术以提高处理速度,而单靠这一技术很难有可靠的分割结果。随着近几年低成本、高性能的CCD摄像机及计算机的出现,不仅可以建立真彩色图像处理系统,而且使用较复杂的算法处理大数据量图像已不太花费时间。
, 百拇医药
本文在真彩色IAS上开发了从显微图像中分割细胞(核)的方法,利用了细胞图像的彩色信息、亮度信息、边缘梯度信息等多种特征,通过将各信息进行加权组合实现改进的水坝分割算法,得到了满意的分割效果。
1 显微图像分割方法分析
显微图像指将组织、细胞制成染色切片或涂片通过显微镜观察到的图像,可以分成许多种类。本文主要以细胞图像为研究对象。一幅染色显微图像十分复杂:细胞核染色深,但边界因染色扩散而与胞浆、背景存在色交叉区且核内物质分布不均;细胞浆染色浅,无固定形状,有泡孔;背景无染色,但可能因光照不均而使亮度分布不均,还含一些杂质、污点。另外,采用复染技术,阳性、阴性细胞呈不同颜色。
图像分割方法主要分为阈值法、边缘检测法、聚类分割法、区域生长法等。彩色图像阈值法是灰度图像阈值法的扩展,可以改善灰度图像的分割精度。交互式方法引起人为偏差,自动方法要基于图像中同类区域色差较小而不同区域间色差较大这样的假设,对实际细胞图像显然不太适合。不仅细胞与背景存在颜色交叉区,核内还存在较大颗粒(纹理),使内部色分布不均匀。聚类法从某个角度看类似阈值法,所分的类别空间映射到图像空间中可能存在目标不连续或不连通情况。但聚类法因建立了多维持征空间,可以利用多种特征,对大多数情况分割效果较好。可惜好的聚类算法参数设置多且运算量太大。使用彩色边缘检测方法的难点是边界的连续性,如何合并各边缘段成为一个闭合域是较难的任务,一般采用启发式方法连接。但对于细节多的图像就更难了。基于区域的方法利用彩色相似性、空间连续性及边界对比度等决定区域的生长、合并或分裂,该方法可能因反复迭代而花费时间,种子点的位置也影响结果。
, 百拇医药
实际上,对于细胞图像的复杂情况,只能采取混合使用几种分割方法的策略,既提高分割精度,又减小难度和运算量。由上分析,我们认为对细胞图像的分割应在仔细研究处理景象的前提,按粗分—细分—修正三个阶段的分割策略。粗分包括预处理,确定目标范围或提取目标子集,细分过程将目标范围缩小或扩大目标子集直到分割出精细的目标区域,最后可通过人机交互方式剔除局部错误,修正偏差。
2 彩色空间变换和数学形态学
2.1 彩色空间变换
彩色图像由彩色CCD摄像机获得的由R、G、B三基色数据组成。大部分情况下,可以直接在RGB彩色空间处理图像,但对于分割目标可能在三维空间形成混叠的情况,有必要对彩色数据作变换,映射到其它彩色空间中(可以是一维的或二维的),得到较好的分离效果。
采用K-L变换可以得到一组正交特征向量,而主向量代表了大部分彩色信息。虽然这种变换是最优的,但求特征矩阵的运算量太大。Ohta等[2]经过大量实验得出有效特征集(I1,I′ 2,I′ 3)证明接近K-L变换的结果。
, 百拇医药
其它一些彩色空间如Lab空间,HSI空间,YUV空间等反映了不同的彩色分布,对于特定的彩色细胞图像,可能某种空间很适合分割,但需累试确定。
2.2 数学形态学
数学形态学提供的算法很适合对图像作形态处理,可以提取重要的形状特征[3]。腐蚀、膨胀、开和闭运算是数学形态学的基本运算。用开运算处理图像,可以剔除结构元的细节,使边界平滑,消除尖峰、凸缘、切断狭细连接。用闭运算同样平滑边界,并填充小孔,消除凹沟等。
测地形态学是数学形态学的一个分支。水坝(Watershed)分割方法将测地理论的集合运算推广到灰度图像领域[4]。其基本思想是:把灰度图像看作一种地理表面,灰度值对应表面的高低,因而地理表面存在许多峰、谷、盆地、高地等。如图1所示是两个相邻盆地,从盆地底部有泉水涌出,首先涌到较低的盆地,而后涌到较高盆地,称淹没过程。当两个盆地中的水即将会合时,建立一道水坝隔开,称水坝线。对整个地理表面实施淹没就会分割出许多区域。
, 百拇医药
使用水坝算法时,一般先对灰度图作梯度变换,则高梯度的边界对应水坝线。在实施水坝算法时,为克服过度分割,不是在所有盆地间建立水坝,而是从预先选好的标记盆地开始淹没,只在相邻标记的盆地间建立水坝,因而可分割出有意义的区域。
在水坝分割算法中,采用了多级队列的数据结构存贮待处理象素。一个象素按它的灰度(或梯度)值的高低送入相应排队级别的队列中。因为淹没过程从最低的盆地开始,所以灰度值越小优先级越高。需处理的象素首先从优先级高的队列中取出,当高级别队列为空时,再处理下一级队列中的象素,因而模拟了淹没过程。可以看出,水坝算法是边缘检测和类似区域生长过程的混合方法。
图1 水坝分割方法的二维剖面图示
3 分割算法
3.1 粗分阶段
, 百拇医药
这一步骤对原始彩色图像作预处理,并依水坝分割算法需要,将代表各核区的细胞核标记及背景标记提取出来。
首先分别对R、G、B三个分量作中值滤波,滤除各分量中引入的随机噪声。按彩色模型定义,从RGB分量中求出亮度图像Ⅰ,并使Ⅰ的灰度范围在0~255间,将背景定义为低亮度,细胞核等为高亮度。对亮度图像使用开运算滤波,结构元取5×5到9×9大小的尺寸(对256×256分辨率的图像)以除去图像中的小的非核物质。
其次,提取标记区。经过滤波后的亮度图像在大部分情况下,细胞核与背景已具有较好的对比度,采用自动阈值法可提取出各核区的子区域。但对于较复杂的情况仍需由人工交互方式标记细胞核。背景区是核区关于整个图像集合的补集。由于核标记区是实际核区的子集,对标记区作若干次膨胀,次数由预实验确定,使膨胀区域大于实际核区,再求补即得到代表背景区的标记区。同样,对于较复杂的情况也需由人工交互方式方法。
最后对已提取的核标记区和背景标记区分别赋予唯一标号(1,2,…,n),未标记区赋予标号0,成为水坝分割算法的初始标记区。
, 百拇医药
3.2 多特征加权组合的水坝分割算法
对于经典的水坝分割算法,利用灰度图像的梯度信息,即在梯度高的部分建立水坝,因而对应得到图像边缘。但有时梯度信息会受到干扰,例如核标记落在纹理区内,会将高纹理边缘形成水坝,造成分割错误。为此,我们将细胞核的多个特征融合起来。利用各特征值加权组合方式形成一个新的图像代替原算法中的梯度图。这些特征可以是:①亮度信息,反映各目标及背景的明暗程度②梯度信息,反映细胞核的边界特征;③彩色信息,反映核内彩色的局部特征相似性④纹理信息,反映核内的纹理匀一而边界纹理突变的特征。
(1)局部彩色分布相似性的组合分量 首先将RGB彩色空间变换到(I1,I′2,I′3)空间。为简化计算,只使用I1、I′2两个主要分量。
, http://www.100md.com
在水坝算法初始化时,分别求出I1、I′2分量在各标记区(核区和背景)内的均值M1(i)、M2(i)和方差σ1(i)、σ2(i),i=1,2,…,n为各标记区标号。在算法中,设P(x,y)点为待入队的一点,它的邻点已标记为第k号。以I1分量为例,则有level1=|I1(x,y)-M1(k)|,反映P(x,y)点在I1分量上与第k号标记区的相近程度,level1越小,一致性越好。为使组合分量有可比性,对level1作如下归一化处理。由于level1的值集中在0~2σ1间,作分段线性化到0~149。
, 百拇医药
同理可定义L2,表示P(x,y)点在I′2分量上与第k号标记区的一致性。
(2)梯度组合分量 用形态梯度算子可求得亮度图Ⅰ的梯度,表示为
ES=min{EG,DG}
其中
显然ES (I) 大的图像点往往对应边界。同样也对ES (I) 作归一化处理到0~149。
(3)线性组合 将以上各特征进行加权组合形成用于水坝算法的新图N,表示为:
, 百拇医药
N=w1×ES+w2×L1+w3×L2
其中,w1+w2+w3=1
图像N与经典水坝算法中的梯度图有类似之处,在于:N值小对应灰度变化小,色彩相似;N值大对应存在灰度变化、色彩变化的边界。
对于加权系数w1,w2和w3的取值得由所处理的显微图像各特征的性质而定。如果梯度信息对分割结果贡献大,则取w1大些;如果核区与胞浆、背景的颜色有较大差异,或核区中含较多纹理,则取w1小些而w2、w3取大些。具体取多大权值,应通过实验样本得到。
, 百拇医药
3.3 算法步骤
综上所述,细分割过程可按以下步骤实现:①提取细胞核、背景的标记区,分别给予唯一标号i=1,2,…n,未标记区为0,形成图像M;②初始化各优先级队列为空(共150级);求梯度图ES;求各标记区的彩色统计参数L1、L2;③扫描标记区边界各点的邻域,当有未标记点即M(x,y)=0时,计算该点的N值,并按其大小将该点入队;④从最高优先级别非空队列开始,从中取出一点P,扫描其邻域,如果只有一个邻点已标记为k,则给P点赋值k,并使k号标记区域生长一点(这时要修正该标记区的彩色统计参数);如果有两个已标记的邻点,认为P点为边界点;⑤对于P点的其它邻点,如果有未标记点,计算该点的N值,并按N值大小放入相应优先级别的队中;⑥当所有级别的队列均为空,表示全图像点已处理完毕,即每一点都被分配到各标记区域中或定为边界点。否则返回到第4步继续处理。
3.4 分割结果修正
, http://www.100md.com
经过水坝算法分割后的区域基本已区分出各细胞核得到准确的核边界。但对于多核团聚情况,如果被标记为一个标记区,只能分割出该团聚区的外边界。要将内部各核分离,须看团聚的可分离性了。对于团聚、重叠不严重的情况,可重新作标记分离该区各核[5]。
4 实验结果
采用文中的分割算法,对18例细胞图像作了分割实验,其中12例HE染色血液细胞,8例巴氏染色宫颈脱落细胞,共约130个各类细胞。
图2(a)是一幅血液细胞彩色图像的灰度图。很明显有5个较大的白细胞,其核呈暗红色,胞浆呈浅紫色。周围有若干较小的浅综色红细胞。下方偏右是两块黑色杂质。
图2(b)是代表白细胞核的标记区。注意到用直方图自动分割法分离了背景、细胞浆、红细胞,但两块杂质暂未消除,并且没有将中间3个核分别标记。
, 百拇医药
图2(c)是对亮度图像做形态梯度运算的结果,反映了原图的梯度信息。
图2(d)是仅利用梯度信息分割图像,由于细胞浆边界与背景间有较大的梯度,结果我们得到了细胞浆的边界。图2(e)考虑到彩色信息,用本文算法,分别取加权系数为w1=0.6,w2=0.15,w3=0.25,得到了细胞核的边界。最后在修正阶段,进一步分离开3个相粘连的核(图2(f))。
图2 多特征融合的水坝分割结果
5 结 论
通过对显微图像的分析,本文提出了综合多种图像信息的分割策略和算法。实验结果表明,80%以上的细胞被正确分割出核边界,少数背景复杂的细胞及团聚细胞核经过适当修正可分割出满意的结果。对于错分的区域(如图2(f)中的杂质),在进一步的图像分析或模式识别中,可以利用形态特征或彩色特征等加以剔除。
, 百拇医药
此方法除了分割效果较好,另一个优点是,不仅划出了各区域的边界,而且区域内部各象素均已赋标号值,各区域的彩色特征也已得到(彩色分量均值、方差),为进一步的特征分析提供了有用数据,减少了特征提取的运算量。
此分割方法在一些方面仍需深入探讨。首先是关于加权系数的确定,作者考虑用样本统计方法给各系数一定的取值范围。其次是纹理信息的利用,可以观察到许多细胞结构具有较强的纹理特征,尤其是核异质细胞和癌细胞,对这类细胞的分割宜融入纹理信息,作者正寻求一种反映纹理均一性的计算量又小的纹理判据。另外,采用何种彩色空间能更好地分离多个目标和背景,目前暂使用累试的办法。
作者简介:马东(1967—),男,西安交通大学博士研究生,讲师。
6 参考文献
[1] Chan KL. Quantitative characterization of electron micrograph image using fractal feature. IEEE Trans BME, 1995,42(10):1033-1037
, http://www.100md.com
[2] Ohta Y, Kanade T, Sakai T. Color information for region segmentation. CGIP, 1980, 13(3):222
[3] Serra J. An introduction to mathematical morphology, CVGIP, 1986; 35:283-305
[4] Vincent L, Soille P. Watersheds in digital spaces: an efficient algorithm based on immersion simulations. IEEE Trans. PAMI, 1991;13(6):583-598
[5] 马东,曹培杰等.分割重叠细胞核的方法及比较研究.北京生物医学工程,1999;18(3):141-146
(1998-12-28收稿,1999-06-02修回), 百拇医药