攻读硕士学位研究生试卷(作业)封面
(2015至2016学年度第一学期)
题目科目姓名专业入学年月
论文选读聚类分析中Kmea
s算法综述
王苑茹计算机技术2015年8月
简短评语
成绩:
授课教师签字:
1
f聚类分析中Kmea
s算法综述
摘要聚类分析是数据挖掘中一个极其重要的研究方向,是一个将数据划分成
簇的方法或手段。聚类分析可广泛利用在商务智能,Web搜索,生物学以及图像模式识别等众多方面。本文主要叙述聚类分析中的Kmea
s聚类算法,总结了Kmea
s聚类算法的研究现状,并针对Kmea
s算法的相关改进做了综述。关键词:Kmea
s聚类算法;数据子集;聚类中心;相似性度量和距离矩阵
OverviewofKmea
salgorithmi
clusteri
ga
alysis
AbstractClusteri
gismajorfieldi
datami
i
gwhichalsoisa
importa
t
methodofdatapartitio
orgroupi
gClusteri
g
owhasbee
appliedi
tovariouswaysi
busi
essi
tellige
ceWebclassificatio
biologymarketa
dsoo
I
thispaperwei
troducethespatialclusteri
grulesAtthesametimetheclassicalKmea
salgorithmisdescribeA
dsomerelatedimproveme
tstoKmea
salgorithmaresummarized
KeywordsKmea
sclusteri
galgorithm
umberofclustersKclusteri
itializatio
dista
cemetric
2
f1、引言
Kmea
s聚类算法是1955年由Stei
haus、1957年Lloyed、1965年BallHall、1967年McQuee
分别在他们各自研究的不同的科学领域独立提出的。空间聚类分析方法是空间数据挖掘理论中一个重要的领域,是从海量数据中发现知识的一个重要手段。kmea
s算法是空间聚类算法中应用非常广泛的算法,同时它也在聚类分析中起着重要作用。日益丰富的空间和非空间数据收集存储于空间数据库中,随着空间数据的不断膨胀,海量的空间数据的大小、复杂性都在快速增长,远远超出了人们的解译能力,从这些空间数据中发现邻域知识迫切需求产生一个多学科、多邻域综合交叉的新兴研究邻域,空间数据挖掘技术应运而生。虽然kmea
s聚类算法被提出已经快60年了,但是目前仍然是应用最为广泛的划分聚类算法之一1。容易实施、简单、高效、成功的应用案例和经验是其仍然流行的主要原因。本文主要叙述聚类分析中的Kmea
s聚类算法,总结了Kmea
s聚类算法的研究现状,并针对Kmea
s算法的相关改进做了综述。
2、经典Kmea
s算法
21Kmea
s算法
kmea
s聚类算法是一种基于形心的划分技术,是数据挖掘领域最为常用的聚类方法之一,最初起源于信号处理领域。它的目标是划分整个样本空间为若干个子空间,每个子空间中的样本点距离该空间中心点平均距离最小。因此,kmea
s是划分聚类的一种。
kmear