文档视界 最新最全的文档下载
当前位置:文档视界 › FCM聚类算法和粗糙集在医疗图像分割中的应用_张东波

FCM聚类算法和粗糙集在医疗图像分割中的应用_张东波

FCM聚类算法和粗糙集在医疗图像分割中的应用_张东波
FCM聚类算法和粗糙集在医疗图像分割中的应用_张东波

第27卷 第12期2006年12月仪器仪表学报

Chinese Jo ur nal of Scientific Instr ument

V ol 27N o 12

Dec 2006

FCM聚类算法和粗糙集在医疗图像分割中的应用*

张东波1,2 王耀南1

1(湖南大学电气与信息工程学院 长沙 410082)

2(湘潭大学信息工程学院 湘潭 411105)

摘要 本文通过结合FCM聚类算法和粗糙集,提出了一种新的图像分割方法。首先,以不同聚类数情况下FCM的分割结果为依据构建属性值表,基于属性构成的不可分辨关系将图像分成多个小区域;然后,通过值约简获得各属性权值并以此为依据,计算各区域之间的差异度,进而通过差异度定义的等价关系,实现各区域相似度评价;最后,通过相似度定义的最终等价关系实现区域合并,完成图像分割。该方法在人工生成图像和大脑CT图像及M R I图像的分割中得到验证,实验结果表明,本文方法和FCM方法相比,可以降低错分率,且对模糊边界区域的分割效果较好。

关键词 FCM聚类 粗糙集 图像分割

中图分类号 T P391.4 文献标识码 A 国家标准学科分类代码 520.6040

Medical image segmentation based on FCM clustering and rough set

Zhang Dongbo1,2 Wang Yaonan1

1(Col lege of Electr ical and I nf o rmation Engineer ing,H unan Univers ity,Chang sha410082,China)

2(I nstitute of I nf or mation E ngineer ing,X iangtan Univer sity,X iangtan411105,China)

Abstract A new image segmentation m ethod is introduced,w hich integrates FCM clustering and r oug h set theory.First,using FCM clustering results w ith different cluster number s,an attr ibute value table is con structed;and the im ag e is divided into m any small regions based on the indiscernibility relations of the at tributes structure.T hen,using'value reductio n',the w eights of the attributes are obtained,and the dissimi larities of the reg ions are calculated.The equivalent relations defined by the dissimilarities are used to ev alu ate the similarities o f the reg io https://www.docsj.com/doc/1810704406.html,stly,the final equiv alent relatio ns based on the similarities are used to implement the com bination of the similar r eg ions and the im ag e segm entation is accomplished.The method w as applied to an artificial generated image,a human brain CT imag e and a M RI imag e.The ex perimental results indicate that,com paring w ith FCM method,the pro posed m ethod decreases the er ror rate o f classifi cation and has better segmentation per for mance fo r v ag ue boundary regions.

Key words FCM cluster ing rough set image segmentation

1 引 言

在以往的图像分割技术中,基于阈值的分割是一种基础性的方法,该方法算法简单,在处理速度上有优势,但不适合于图像中模糊边界区域的分割。对模糊边界区域的分割,通常采用无监督聚类方法,常用的有K均值聚类方法[1]、模糊C均值方法FCM[2]、ISO DA TA方法[3]等。其中FCM方法是一种具有模糊决策能力的聚类算法,它对模糊边界区域的分割非常有效,得到了广泛应用。

最早由波兰数学家Z.Pawlak提出来的粗糙集理

*本文于2005年10月收到,系国家自然科学基金(60375001)、高等学校博士点基金(20030532004)、湖南省教育厅资助科研(05C093)资助项目。

1684

仪 器 仪 表 学 报第27卷论[4],是处理不确定、不完整、不精确知识的有力工具,该

理论已成为不确定性计算领域的一个重要分支。粗糙集

基于不可分辨关系、上下近似、约简等概念将知识颗粒

化,直接模拟了人类的逻辑思维能力,成为人工智能和认

知科学的基础,效的处理技

术。由于图像信息具有较强的复杂性和相关性,处理过

程中经常会遇到不完整性和不确定性问题,因此将粗糙

集理论应用到图像处理中,有时会具有比一般的硬计算

方法更好的性能。目前,粗糙集已经应用于图像增

强[5 6]、图像分割[7 8]、图像滤波[9 10]等,从文献[5 10]中可

以得知,基于粗糙集的图像处理均能获得较好的效果,尽

管如此,粗糙集在图像领域的应用仍处在探索阶段,新的

方法、新的技术仍有待深入研究和探讨。

本文结合FCM聚类算法和粗糙集理论给出一种新

的图像分割方法,用不同FCM聚类数条件下的聚类结果

来构成待处理图像的属性值表,根据不可分辨等价关系,

可以将图像数据分割成多个小的区域,然后通过粗糙集

的值约简概念计算各属性的权重,并以此计算各区域之

间的差异度,通过差异度构成初始等价关系。由基于差

异度的初始等价关系对区域的划分,可以进一步计算各

区域之间的相似度,最终以相似度描述作为最终的等价

关系,实现相似区域的合并,完成最终的图像分割。该方

法在人工生成图像和医疗诊断中的大脑CT图像及M RI

图像的分割中得到应用和验证,获得了良好的分割效果。

2 FC M聚类算法

设有限集X={x1,x2, ,x n}是n个样本组成的集

合,c为预定的类别数,m i(i=1,2, ,c)是每一个聚类的

中心, j(x i)是第i个样本关于第j类的隶属度,聚类准

则函数由隶属函数定义为:

J(M,V)= c j=1 n i=1[ j(x i)]b x i-m j 2(1)

式中: x i-m j 是x i到m j之间的欧氏距离;b是模糊

加权幂指数,是可以控制聚类结果模糊程度的参数;M

是X的模糊C划分矩阵,V是X的聚类中心集合,FCM

聚类算法的结果就是要获得使准则函数达到最小的M

和V。在模糊C均值聚类方法中,要求样本对各个聚类

的隶属度之和为1,即:

c j=1

j

(x i)=1, i=1,2, ,n(2)

在式(2)的条件下求式(1)的极小值,令J(M,V)对m j和 j(x i)偏导数为0,可得极小值的必要条件为:

m j= n i=1[ j(x i)]b x i

n

i=1

[ j(x i)]b

, j=1,2, ,c(3)

j

(x i)=(1/ x i-m j

2)1/(b-1)

c k=1(1/ x i-m k 2)1/(b-1)

,

i=1,2, ,n;j=1,2, ,c(4)

FCM算法可以按照以下迭代步骤完成:

(1)设定聚类数目c和参数b,算法终止阈值 ,迭代

次数t=1,允许最大迭代数为t max;

(2)初始化各个聚类中心m i;

(3)用当前聚类中心根据式(4)计算隶属函数;

(4)用当前隶属函数按式(3)更新各类聚类中心;

(5)选取合适的矩阵范数,如果 V(t+1)-V(t)

或t t max,停止运算;否则,t=t+1,返回步骤(3)。

当算法收敛时,得到各类的聚类中心和各个样本对

于各类的隶属度,完成模糊聚类划分。最后将模糊聚类

结果进行去模糊化,将模糊聚类转变为确定性分类,实现

最终的聚类分割。

3 粗糙集基本理论

3.1 等价关系与粗糙集

粗糙集从模式分类的观点来描述知识,通过不可分

辨的等价关系,将知识空间划分为不同的模式等价类,从

而将知识空间表示为粒状结构。正是因为知识的这种粒

状结构,造成知识表示的粗糙性。令子集X U,R是对

论域U进行划分的一个等价关系,则划分U/R定义为:

定义:划分U/R={X1,X2, ,X n};X i U,X i

X i X j= ; n

i=1

X i=U;其中i j,i,j=1,2, ,n。

3.2 不可分辨关系

若R是一个等价关系,任意的X i U/R称之为R

等价类,其中包含的等价类记作[x]R。论域的所有等价

关系族R={R},构成信息系统K=(U,R)。若P R,且

P ,则 P(P中所有等价关系的交集)也是一个等价

关系,称为P上的不可分辨关系,记为ind(P),且有:

[x]ind(P)=

R P

[x]R(5)

3.3 值约简

粗糙集进行数据分析时,通常会进行属性约简、规则

提取、值约简、决策规则的极小化等一系列处理,由于后

续进行区域差异度计算时要用到值约简的概念,因此有必

要对它做简要的介绍。类似于属性约简(针对全体论域),

对某一对象来说,并非所有的属性都是必要的,因此有值

约简问题,有的文献称为规则约简。对于信息系统K=

(U,R),如R是等价关系族,另有P R,Q P,定义对象

x i的值约简r i:

r i={A i(P)|[x i]p [x i]R,[x i]Q [x i]R}(6)

式中: P R,Q P。

A i(P)是与关系P相关的对象x i的属性值。如某

第12期张东波等:FCM聚类算法和粗糙集在医疗图像分割中的应用1685

属性是不可约去的,则称该属性对x i是必要的,否则,是

不必要的。

4 基于FC M和粗糙集的图像分割算法

4.1 基于FCM的信息表构造和区域划分

为实现图像分割,首先要构造能进行图像分割的信息

表。通过改变FCM聚类数进行多次聚类计算,不同的聚

类数作为待分割像素的属性,聚类分割结果作为属性值,

可以构造出一个反映图像分割关系的信息表。以全部聚

类属性作为不可分辨等价关系,将数据分割成等价类{z1,

z2, ,z n},每一个基本类z i,表示图像的一个小基本区域。

4.2 基于值约简的属性权值和基本区域差异度计算

信息表中的每一个属性对分类的作用是不一样的,

因此必须考虑到不同属性的重要性,给予不同的权重,以

便进行合理的决策。在对象的值约简处理中,对每一个

对象来说,可能有一个或多个属性是不必要的,而对整个

论域的值约简进行统计,在所有的值约简中,出现频率越

高的属性对分类来说越重要,因此,可以此为基础定义属

性的权值。

若z i(i=1, ,n)是分割出来的图像基本区域,a k是

第k个属性,v i是区域z i的值约简,v i(a k)是属性a k关

于值约简v i的取值,l是所有基本区域的值约简数,则属

性w k的权值定义如下:

w k=1-

z

i

v i(a k)

l

(7)

式中:v i(a k)=1,如果a k是v i中必要的

0,如果a k是v i中不必要的

在获得各属性的权值后,基本区域间的差异度定义如下:

d(z i,z j)= m k=1(w k k ij)(8)

式中: k ij=0,如果a k(z i)=a k(z j) 1,如果a k(z i) a k(z j)

a k(z i)是基本区域z i的属性a k取值,根据定义,差异度满足d(z i,z j)=d(z j,z i),d(z i,z i)=0。

4.3 基于差异度的初始等价关系及相似域划分

设定一个差异度指数 d,可以定义基于差异度的初始等价关系{R i},i=1, ,n,将论域划分为相似域[z i]R

i 和非相似域[z i]R i:

U/R i={[z i]R i,[z i]R i},i=1, ,n(9)

式中:

[z i]R i={z j|d(z i,z j) d}

[z i]R i={z j|d(z i,z j)> d},j=1, ,n

(10)

4.4 基于相似度的最终等价关系及分割

最终为实现图像的分割,必须对基本区域的相似性进行度量,设相似性指数为 s,从而构造如下的最终等价关系{r i},i=1, ,n,将论域进行如下的划分:

U/r i={{z j|s(z i,z j) s},{z j|s(z i,z j)< s}},

i,j=1, ,n(11)式中:[z i]r i={z j|s(z i,z j) s},s(z i,z j)是基本区域z i 和z j之间的相似度,定义如下:

s(z i,z j)=

n

k=1

in k(z i,z j)

n,i j

1, i=j

(12)式中:i n k(z i,z j)=

1,z i [z i]r k且z j [z i]r k

0,否则

,相似度满足s(z i,z j)=s(z j,z i),s(z i,z i)=1。

在确定最终等价关系并进行区域划分后,以全部等价关系{r i},i=1, ,n构成不可分辨关系ind(r),定义如下:

[z]ind(r)=

r

i

r

[z]r i(13)通过最终的不可分辨关系,实现最后的图像分割。

5 图像分割实验

为验证方法的有效性,本文选择了

1幅人工生成图像及2幅大脑医疗图像(一为CT图像,一为M RI图像)进行实验。

5.1 人工生成图像分割

图1(a)是88 88的原图像,对原图像采用5 5窗口,进行60次平滑操作,得到图1(b);图1(c)是采用FCM聚类算法,聚类数为4时的分割结果;图1(d)是本文方法分割结果。

在采用本文方法对人工图像进行分割时,为对上述算法有一个更清晰的认识,对各步骤做了简要阐述。

图1 人工生成图像分割实验

5.1.1 基于FCM的信息表构造和区域划分

分别取聚类数K=2,3,4(分别对应属性a1、a2、a3)

1686

仪 器 仪 表 学 报第27卷对图1(b)进行聚类分割,以相应的分割结果作为属性值

(其中,a1={1,2}、a2={1,2,3}、a3={1,2,3,4})构造属

性值表,根据全部属性定义的等价关系进行划分,可以得

到信息表,列于表1。其中,每一个对象代表一个基本

区域。

表1 信息表

对象像素数

属性

a1(K=2)a2(K=3)a3(K=4)

z11617112

z22336131

z3332132

z4151212

z5972213

z6592223

z71744224

5.1.2 值约简、属性权值、区域差异度计算

根据式(6)值约简的定义,计算值约简,并根据权值的定义式(7)计算各属性的权值,列于表2。

表2 值约简表及权值

对象区域

属性

a1a2a3

z111*

z2**1

z3*32

z42*2

z5*13

z6*23

z7**4

权值0.7140.4290.143

注: * 表示可约的不必要的属性。

根据差异度定义,得到各基本区域之间的差异度矩阵d ij,i,j=1, ,7,根据定义d ij是一个对角元素全为0的对称矩阵。

d ij=00.5710.4290.7140.8571.2861.286 0.57100.1431.2861.2861.2861.286 0.5711.2861.14300.1430.5710.571

0.8571.2861.2860.5710.42900.143

1.2861.2861.2860.5710.5710.1430

5.1.3 基于区域差异度的区域划分

取差异度指数,根据差异度定义的初始等价关系,将基本区域做如下相似域和非相似域的划分:

U/R1={{z1,z2,z3,z4,z5},{z6,z7}}

U/R2={{z1,z2,z3},{z4,z5,z6,z7}}

U/R3={{z1,z2,z3},{z4,z5,z6,z7}}

U/R4={{z1,z4,z5,z6,z7},{z2,z3}}

U/R5={{z1,z4,z5,z6,z7},{z2,z3}}

U/R6={{z4,z5,z6,z7},{z1,z2,z3}}

U/R7={{z4,z5,z6,z7},{z1,z2,z3}}

5.1.4 基于相似度的最终等价关系及分割

根据相似度定义及基于差异度的初始等价关系对基本区域的划分情况,可以计算反映各区域之间相似性的矩阵s ij,i,j=1, ,7,s ij是一个对角元素全为1的对称矩阵。

s ij=

10.4290.4290.4290.4290.4290.286

0.42910.4290.1430.14300

0.4290.42910.1430.14300

0.4290.1430.14310.7140.5710.571

0.4290.1430.1430.71410.5710.571

0.286000.5710.57110.571

0.286000.5710.5710.5711

取相似度指数 s=0.429,根据相似度定义的最终等价关系,做如下的区域划分:

U/r1={{z1,z2,z3,z4,z5},{z6,z7}}

U/r2={{z1,z2,z3},{z4,z5,z6,z7}}

U/r3={{z1,z2,z3},{z4,z5,z6,z7}}

U/r4={{z1,z4,z5,z6,z7},{z2,z3}}

U/r5={{z1,z4,z5,z6,z7},{z2,z3}}

U/r6={{z4,z5,z6,z7},{z1,z2,z3}}

U/r7={{z4,z5,z6,z7},{z1,z2,z3}}

最后由式(13)实现基本区域的合并完成图像分割,总共分割为4类,结果如下:

C1={z1},C2={z2,z3},C3={z4,z5},C4={z6,z7}。

图像分割结果如图1(d)所示,与具有同等聚类数的FCM方法对图像的分割结果进行比较,显然,本文方法对边界域的分割更细致。

5.2 CT图像分割

CT图像具有较高的密度分辨率,通过由黑到白不同的灰度等级来表示成像区的组织密度,偏黑色区域表示低吸收区,即低密度区,如软组织;白色区域表示高吸收区,即高密度区,如骨骼,因此其对骨骼和软组织有较强的分辨能力。大脑CT图像在临床上,经常用于颅脑放射治疗、颅脑手术的医疗诊断。

图2(a)是大脑CT图像,整个图像大致分3类:背景、骨骼、软组织。图2(b)是FCM算法分割结果,部分软组织区域被错分为背景,见图中白色方框区域。取属性a1(K=2)、a2(K=3)建立信息表,取 d=0.857、 s= 0.286,使用本文算法的分割结果如图2(c)所示。FCM 算法中被错分的软组织得到了准确的分割,骨骼、软组织、背景的划分很清晰。

5.3 MRI图像分割

MRI成像主要是利用人体中最多的氢质子在磁场中产生的共振效应,通过计算机处理后得到图像。M RI 图像的优势在于对软组织有较高的对比分辨率,有利于

第12期张东波等:FCM 聚类算法和粗糙集在医疗图像分割中的应用1687

图2 大脑CT 图像分割实验

区分各种软组织和对病变组织进行定位,因此在医疗诊

断中得到广泛应用。

图3(a)是大脑M RI 图像,整个图像大致分5大类:背景、头骨、灰质、白质、其他组织。其中,大脑内白质和灰质的区分对病变组织的定位非常重要,图3(b)是FCM 算法分割结果,关键区域即灰质和白质的分割不清晰,白质被分割成多个非连续的区域,而采用本文算法,白质可以被分割成一个连通的整体区域,使得白质和灰质有较为清晰的分割边界。分割结果如图3(c)所示。其中建立信息表的属性有a 1(k =2)、a 2(K =3)、a 3(K =4)、a 4(K =5),阈值指数 d =2、 s =0.375

图3 大脑M R I 图像分割实验

6 结 论

本文以FCM 分割算法为基础,结合粗糙集理论介绍了一种新的图像分割方法,该方法在人工生成图像、大脑CT 图像及MRI 图像的分割中得到应用和验证,具有良好的分割效果。与FCM 方法相比,该法可以降低错分

率,对模糊边界区域的分割效果较好。

由于图像信息具有较为复杂的空间相关性和不确定性,而粗糙集理论处理不确定性信息的独特方式、相关信息提取能力,以及和其他智能方法的易融合性使得粗糙集在图像处理领域具有良好的应用前景,但目前这方面的研究成果还很少。因此,有必要对粗糙集在图像处理领域的应用进行积极的理论研究和探寻新的方法。 参考文献

[1] SELI M S Z,ISM A IL M A.K means ty pe alo go rithm

[J].IEEE T r ansactio ns on Pat tern A nalysis and M a chine Intellig ence,1994,6(1):81 87.

[2] BEZD EK J C.Patter n r eco gnit ion with fuzzy o bject ive

function algorithms[M ].N ew Yo rk:P lenum Press,1981.

[3] 边肇祺,张学工,张长水,等.模式识别[M ].北京:清

华大学出版社,2000.

[4] PA WL A K Z.Roug h set theo ry and its a pplicat ion to

data analysis [J].Cybernetics and Systems,1998,29

(9):661 688.

[5] 徐立中,王慧敏,杨锦堂.基于粗糙集理论的图像增强

方法[J].仪器仪表学报,2000,21(5):514 515,524.

[6] 董广军,范永弘,罗睿.基于粗糙集的图像智能增强预

处理[J].计算机工程,2003,29(13):57 58,61.

[7] P AL S K ,P ABIT RA M.M ultispectr al imag e seg men

tatio n using t he ro ug h set initialized EM alg or ithm[J].IEEE T ransact ions on Geoscience and R emote Sens

ing,2002,40(11):2495 2501.

[8] M O HA BEY A,RA Y A K.Roug h set theor y based

segmentatio n o f co lo r imag e[A ].Pr oceeding s o f IEEE 19th Inter nat ional M eeting o f t he N or th A merican Fuzzy Info rmation Pr ocessing Society [C ],2000:338 342.

[9] WO JCIK Z M.A pplication o f roug h set s for edg e en

hancing image filter s[A ].Internatio na l Conference on Imag e P ro cessing [C ],1994,A ustin,T ex as,U SA 2:525 529.

[10] 陈真诚,张锋,蒋大宗,等.利用多分辨率分析的胸部

X 线数字图像粗糙集滤波增强[J].中国生物医学工

程学报,2004,23(6):486 489.

作者简介

张东波,男,1973年出生,博士研究生,讲师,主要研究方向为粗糙集、图像处理和模式识别等。

E mail:zhadonbo@y aho o.co https://www.docsj.com/doc/1810704406.html,

基于谱聚类的图像分割

本科生毕业设计 姓名:学号: 学院:计算机科学与技术学院 专业:计算机科学与技术 设计题目:基于谱聚类的图像分割 专题:图像分割的设计与实现 指导教师:职称:副教授

大学毕业设计任务书 学院计算机专业年级学生姓名 任务下达日期: 毕业设计日期: 毕业设计题目: 毕业设计专题题目 毕业设计主要内容和要求: 院长签章:指导教师签字:

中国矿业大学毕业设计指导教师评阅书 指导教师评语(①基础理论及基本技能的掌握;②独立解决实际问题的能力;③研究内容的理论依据和技术方法;④取得的主要成果及创新点;⑤工作态度及工作量;⑥总体评价及建议成绩;⑦存在问题;⑧是否同意答辩等): 成绩:指导教师签字: 年月日

中国矿业大学毕业设计评阅教师评阅书 评阅教师评语(①选题的意义;②基础理论及基本技能的掌握;③综合运用所学知识解决实际问题的能力;③工作量的大小;④取得的主要成果及创新点;⑤写作的规范程度;⑥总体评价及建议成绩;⑦存在问题;⑧是否同意答辩等): 成绩:评阅教师签字: 年月日

中国矿业大学毕业设计答辩及综合成绩

需求分析 一、利用前台,得到一张原始JPG图片; 二、把这张图片传到后台,JAVA通过JRI调用R; 三、利用R调用K-Means的改进算法,实现对这张图片的处理,由于一张图片的 像素值是一个矩阵,可以得到一组关于像素值的数据; 四、把这组像素值进行分类,对各类赋予不同的颜色进行标记,从而区分出需要的 图片信息; 五、把得到的新图片传到前台; 六、前台对进行处理后的图片进行显示,从图像中得到需要的信息,从而实现图像 的分割。

kmeans聚类图像分割 matlab

function [mu,mask]=kmeans(ima,k) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%% % % kmeans image segmentation % % Input: % ima: grey color image % k: Number of classes % Output: % mu: vector of class means % mask: clasification image mask % % Author: Jose Vicente Manjon Herrera % Email: jmanjon@fis.upv.es % Date: 27-08-2005 % %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%% % check image ima=double(ima); copy=ima; % make a copy ima=ima(:); % vectorize ima mi=min(ima); % deal with negative ima=ima-mi+1; % and zero values s=length(ima); % create image histogram m=max(ima)+1; h=zeros(1,m); hc=zeros(1,m); for i=1:s if(ima(i)>0) h(ima(i))=h(ima(i))+1;end; end ind=find(h); hl=length(ind); % initiate centroids mu=(1:k)*m/(k+1);

谱聚类Clustering -

聚类分析 1.聚类分析定义: 2.聚类方法: 3.谱聚类: 3.1 常见矩阵变换 3.2 谱聚类流程 3.3 谱聚类理论前提、证明 3.4 图像分割实例结果 4.总结:

聚类分析: ?聚类分析(Cluster analysis,亦称为群集分析)是对于静态数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。

算法分类: ?数据聚类算法可以分为结构性或者分散性。 ?结构性算法以前成功使用过的聚类器进行分类。结构性算法可以从上至下或者从下至上双向进行计算。从下至上算法从每个对象作为单独分类开始,不断融合其中相近的对象。而从上至下算法则是把所有对象作为一个整体分类,然后逐渐分小。 ?分散型算法是一次确定所有分类。K-均值法及衍生算法。 ?谱聚类(spectral clustering)

结构型:层次聚类的一个例子:

分散型:K-均值算法:

分散型k-means 及其衍生算法的比较:K-means K-Medoids K-Means算法: 1. 将数据分为k个非空子集 2. 计算每个类中心点(k-means中心点是所有点的average),记为seed point 3. 将每个object聚类到最近seed point 4. 返回2,当聚类结果不再变化的时候stop K-Medoids算法: 1.任意选取K个对象作为medoids(O1,O2,…Oi…Ok)。 2.将余下的对象分到各个类中去(根据与medoid最相近的原则); 3.对于每个类(Oi)中,顺序选取一个Or,计算用Or代替Oi后的消耗E(Or)。选择E最小的那个Or来代替Oi。转到2。 4.这样循环直到K个medoids固定下来。 这种算法对于脏数据和异常数据不敏感,但计算量显然要比K均值要大,一般只适合小数据量。

谱聚类算法及其在图像分割中的应用

谱聚类算法及其在图像分割中的应用 1 引言 在对图像的研究和应用中,人们往往仅对图像中的某些部分或者说某些区域感兴趣。这些部分常称为目标或前景(其他部分称为背景),它们一般对应图像中特定的具有独特性质的区域。为了辨识和分析目标,需要将它们从图像中分离提取出来,在此基础上才有可能对目标进一步利用。图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这里的特性可以是像素的灰度、颜色和纹理等,预先定义的目标可以对应单个区域,也可以对应多个区域。 多年来,对图像分割的研究一直是图像技术研究中的热点和焦点,它不但是从图像处理到图像分析的关键步骤[1],而且是计算机视觉领域低层次视觉中的主要问题。图像分割的结果是图像特征提取和识别等图像理解的基础,只有在图像被分割后,图像的分析才成为可能。 图像分割在实际应用中已得到了广泛的应用,如图像编码、模式识别、位移估计、目标跟踪、大气图像、军用图像、遥感图像、生物医学图像分析等领域。同时,图像分割也在计算机视觉和图像识别的各种应用系统中占有相当重要的地位,它是研制和开发计算机视觉系统、字符识别和目标自动获取等图像识别和理解系统首先要解决的问题。概括地说只要需对图像目标进行提取测量等都离不开图像分割。 对分割算法的研究已经有几十年的历史,至今借助于各种理论已经提出了数以千计的分割算法[2],而且这方面的研究仍然在积极进行。尽管人们在图像分割方面做了许多工作,但至今仍无通用的分割算法,也不存在一个判断分割是否成功的客观标准。因此已经提出的分割算法大都是针对具体问题的,并没有一种适合于所有图像的通用的分割算法。实际上由于不同领域的图像千差万别,也不可能存在万能的通用算法。 现有的分割算法非常多,大体上可以分为以下几类:阈值化分割、基于边缘检测的、基于区域的、基于聚类的和基于一些特定理论工具的分割方法。从图像的类型来分最常见的:有灰度图像分割、彩色图像分割和纹理图像分割等等。本

基于聚类的图像分割方法综述

信息疼术2018年第6期文章编号=1009 -2552 (2018)06 -0092 -03 DOI:10.13274/https://www.docsj.com/doc/1810704406.html,ki.hdzj.2018. 06.019 基于聚类的图像分割方法综述 赵祥宇\陈沫涵2 (1.上海理工大学光电信息与计算机学院,上海200093; 2.上海西南位育中学,上海200093) 摘要:图像分割是图像识别和机器视觉领域中关键的预处理操作。分割理论算法众多,文中 具体介绍基于聚类的分割算法的思想和原理,并将包含的典型算法的优缺点进行介绍和分析。经过比较后,归纳了在具体应用中如何对图像分割算法的抉择问题。近年来传统分割算法不断 被科研工作者优化和组合,相信会有更多的分割新算法井喷而出。 关键词:聚类算法;图像分割;分类 中图分类号:TP391.41 文献标识码:A A survey of image segmentation based on clustering ZHAO Xiang-yu1,CHEN Mo-han2 (1.School of Optical Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai200093,China;2.Shanghai Southwest Weiyu Middle School,Shanghai200093,China) Abstract:Image segmentation is a key preprocessing operation in image recognition and machine vision. There are many existing theoretical methods,and this paper introduces the working principle ol image segmentation algorithm based on clustering.Firstly,the advantages and disadvantages ol several typical algorithms are introduced and analyzed.Alter comparison,the paper summarizes the problem ol the selection ol image segmentation algorithm in practical work.In recent years,the traditional segmentation algorithms were improved and combined by the researchers,it believes that more new algorithms are blown out. Key words:clustering algorithm;image segmentation;classilication 0引百 近年来科学技术的不断发展,计算机视觉和图像 识别发挥着至关重要的作用。在实际应用和科学研 究中图像处理必不可少,进行图像处理必然用到图像 分割方法,根据检测图像中像素不重叠子区域,将感 兴趣目标区域分离出来。传统的图像分割方法:阈值 法[1]、区域法[2]、边缘法[3]等。近年来传统分割算法 不断被研究人员改进和结合,出现了基于超像素的分 割方法[4],本文主要介绍超像素方法中基于聚类的经 典方法,如Mean Shift算法、K-m eans 算法、Fuzzy C-mean算法、Medoidshilt算法、Turbopixels算法和 SLIC 算法。简要分析各算法的基本思想和分割效果。 1聚类算法 1.1 Mean Shil't算法 1975年,Fukunaga[5]提出一种快速统计迭代算法,即Mean Shilt算法(均值漂移算法)。直到1995 年,Cheng[6]对其进行改进,定义了核函数和权值系 数,在全局优化和聚类等方面的应用,扩大了 Mean shil't算法适用范围。1997至2003年间,Co-maniciu[7-9]提出了基于核密度梯度估计的迭代式 搜索算法,并将该方法应用在图像平滑、分割和视频 跟踪等领域。均值漂移算法的基本思想是通过反复 迭代计算当前点的偏移均值,并挪动被计算点,经过 反复迭代计算和多次挪动,循环判断是否满足条件, 达到后则终止迭代过程[10]。Mean shil't的基本形 式为: 收稿日期:2017-06 -13 基金项目:国家自然科学基金资助项目(81101116) 作者简介:赵祥宇(1992-),男,硕士研究生,研究方向为数字图像处理。 —92 —

几种聚类算法在图像分割中的应用研究

龙源期刊网 https://www.docsj.com/doc/1810704406.html, 几种聚类算法在图像分割中的应用研究 作者:苗欣雨 来源:《科教导刊·电子版》2015年第19期 摘要本文具体介绍了图像分割中几种聚类算法的工作原理。通过对比,分析了几种算法的优缺点,总结了在实际工作中对算法的选择问题。 关键词聚类算法图像分割均值漂移 K均值聚类 中图分类号:TP391.41 文献标识码:A 通常在分析以及使用图像时,人们需要的不是整幅图像而仅仅是其中的某些目标。图像分割就是把需要的部分分割出来,再进一步分析处理图像。每个图像都有它独有的特点,对图像进行分割时要想达到预期的结果就必须选择合适的算法,由此可见对算法的研究是很关键也很必要的。目前常用的几种分割方法有k均值聚类算法、模糊c均值算法、均值漂移算法等。 1聚类算法 1.1均值漂移算法 均值漂移(Mean Shift)算法是一种有效的统计迭代算法。均值漂移的算法原理是,在样本中随机选择一圆心为o,半径为h的区域,得出这个区域中所有样本点的平均值,圆心处的样本密度必然比均值处的样本密度小或者相等,将均值定为新的圆心重复以上步骤,直到收敛到密度极大值点。 1.2 K均值聚类算法 k均值聚类由于其原理简单而使用很广泛。该算法的工作原理是,首先将n个样本分为k 个组,在每组中随机选择一个元素当作聚类中心。然后得到其他采样点到这个中心的欧氏距离,把采样点归类到与之欧氏距离最小的聚类中心所在的类中。计算新形成的聚类中采样点的平均值,得到新的聚类中心。重复上述过程,直到每个样本都分类正确为止。 1.3模糊C均值聚类算法 模糊C均值是为解决实际应用问题对K均值进行改进得来的。在实际应用中图像目标在类别属性方面没有那么严格的区分。所以想出利用隶属度来判断每个目标样本的所属,来更好的划分。模糊C均值聚类的具体工作原理是,算法将n个样本分为c个组,得到各个组的聚类中心,最终让非相似性指标的目标函数达到最小。算法给各个样本点赋予0~1之间的隶属度,通过隶属度的值来判断样本归属于各个分类的程度。同时有规定一个样本的隶属度加和后值为一。

谱聚类报告

机器学习报告 一.绪论 聚类是探索性数据分析中广泛采用的一种技术,其应用范围包括统计学、计算机科学、生物学、社会科学和心理学等等。在处理经验数据的时候,我们可能倾向于根据数据的“近似表现”将数据确定到一定的类别。而本次我们小组的实验主要是基于聚类算法中的谱聚类方法,通过对两种谱聚类方法的实验和一些应用,验证算法的效果,加深对该方法的理解。 由于谱聚类的数值实现很简单,利用简单的线性代数学方法就能有效解决,而且相比传统的K 均值方法等聚类方法有很多优点,所以谱聚类方法称为了很流行的现代聚类算法之一。 以K 均值方法为例,正如我们所知,该方法主要存在这样一些问题:首先,其只适用于凸球形的样本空间,如果样本空间非凸,则会陷入局部最优,导致聚类效果不佳;再有,由于该方法计算使用的是欧氏空间中的原始数据向量,所以在样本维数很大的时候,K 均值算法的计算量会很大,导致了计算的困难;聚类数K 难以确定等等。而谱聚类则能很好地解决这些问题。 在本次实验中,我们小组根据相关文献,认真学习和讨论了谱聚类的先关概念。首先,我们研究了一般的谱聚类和标准化谱聚类的概念和它们的异同,并通过实验对比,验证了谱聚类的效果,其中标准化谱聚类有显著的优势。接下来,将谱聚类应用于图像分割问题,显示出谱聚类良好的应用价值。最后,我们查阅相关文献,尝试从另外一个角度去理解谱聚类方法。通过这次学习,我们对谱聚类的理解得到了大大加深,对于很多疑难的地方也通过查看有关文献和小组讨论得到了解决,并通过小组合作锻炼了自身的团队意识和配合工作的能力。 二.谱聚类基本思想 谱聚类是一种基于图论的聚类方法,把样本看作图的顶点,样本间的相似度对应带权值的边(其中相似度可以通过高斯核函数等方法构造),根据类间相似度最小,类内相似度最大的原则,便可以将样本聚类问题变成了图的分割问题:分割使得连接不同类之间的边的权值尽可能小,而类内点之间的边的权值尽可能高。虽然这样对应的最小化图分割问题是一个NP-HARD 问题,但是我们可以将其转化为最小化图的Laplace 矩阵的特征值问题。 具体地,给定样本特征之后,我们首先要计算样本两两之间的相似度值,并通过这些值构造出近邻矩阵。以高斯核函数为例,计算公式如下: 22||||(2)i j x x ij w e σ--= 作为第i 个样本和第j 个样本之间相似度的度量。而近邻矩阵如下: ()ij W w =。

基于聚类分析的图像分割研究毕业论文

毕业论文声明 本人郑重声明: 1.此毕业论文是本人在指导教师指导下独立进行研究取得的成果。除了特别加以标注地方外,本文不包含他人或其它机构已经发表或撰写过的研究成果。对本文研究做出重要贡献的个人与集体均已在文中作了明确标明。本人完全意识到本声明的法律结果由本人承担。 2.本人完全了解学校、学院有关保留、使用学位论文的规定,同意学校与学院保留并向国家有关部门或机构送交此论文的复印件和电子版,允许此文被查阅和借阅。本人授权大学学院可以将此文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本文。 3.若在大学学院毕业论文审查小组复审中,发现本文有抄袭,一切后果均由本人承担,与毕业论文指导老师无关。 4.本人所呈交的毕业论文,是在指导老师的指导下独立进行研究所取得的成果。论文中凡引用他人已经发布或未发表的成果、数据、观点等,均已明确注明出处。论文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究成果做出重要贡献的个人和集体,均已在论文中已明确的方式标明。 学位论文作者(签名): 年月

关于毕业论文使用授权的声明 本人在指导老师的指导下所完成的论文及相关的资料(包括图纸、实验记录、原始数据、实物照片、图片、录音带、设计手稿等),知识产权归属华北电力大学。本人完全了解大学有关保存,使用毕业论文的规定。同意学校保存或向国家有关部门或机构送交论文的纸质版或电子版,允许论文被查阅或借阅。本人授权大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存或编汇本毕业论文。如果发表相关成果,一定征得指导教师同意,且第一署名单位为大学。本人毕业后使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为大学。本人完全了解大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存或汇编本学位论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入学校有关数据库和收录到《中国学位论文全文数据库》进行信息服务。在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。 论文作者签名:日期: 指导教师签名:日期:

基于聚类的图像分割系统的设计与实现——分割算法模块【毕业作品】

BI YE SHE JI (20 届) 基于聚类的图像分割系统的设计与实现——分割算法模块

摘要 图像分割的算法研究已有很多年的历史,一直以来都得到了人们的高度重视。关于图像分割的原理和方法世界各国均有不少的论文发表,但一直以来没有一种一般的分割方法能够适用于所有图像分割处理。传统的图像分割方法的劣势在于不能满足人们的要求,为后续的图像分析和理解带来了困难。随着计算机技术以及计算机性能的迅猛发展,及其相关技术的发展和成熟,结合色彩处理,图像增强等技术,个人计算机上就能够实现图像分割处理。 图像处理技术有很多种,如图像分析,颜色转换,去噪等,但其中最主要的图像处理技术是图像分割技术,从图像中将某个特定区域与其它部分进行分离并提取出来的部分进行检测,变换,识别等处理操作。 图像的分割是实现图形理解的基础,也是计算机图形学中的一个基本问题,并且在其 他很多领域得到了应用。由于图像的格式和色彩形状不同,要实现通用且快速的图像分割仍然是一个难题。图像分割的主要研究内容有:建立可靠有效的分割模型,减少分割算法的运算量,降低分割算法的复杂度,提高分割算法的通用性及抗噪性等。但是因为分割模型的不同,各种分割方法在不同的分割模型表现出不同的优缺点。有阈值分割方法,边界分割方法,区域提取方法,结合特定理论工具的分割方法等。本文只对这些方法做简单的介绍。 本文中着重介绍的是,基于聚类的分割算法,聚类分析是一种无监督分类法,它通过归类相似性质(结构色彩)的样本实现分类。在缺少相关知识时,图像分割可以通过聚类分析完成。基于聚类分析的图像分割算法的通用性好,并且对样本空间的约束小。无论是灰度图像、彩色图像分还是纹理图像,都可以应用聚类分析方法完成分割。但是基于聚类分析的分割方法也有缺点,主要就是因为聚类分析分割算法计算量大,有可能出现极值问 题并且对噪声样本比较敏感。本文分析了当今图像分割的研究成果以及面临的主要问题,针对聚类算法用于图像分割的特点,着重对聚类算法进行了算法实现,并能用图片的形式呈现出来。 通过对聚类算法的是实现,本文在其基础上还对分割后的图片进行重新合并的操作,合并操作通过比对,计算图片碎片的相似度进行实现。 关键词:图像分割,复杂度,样本空间,聚类分割,合并,相似度

相关文档