全球旧事资料 分类
龙源期刊网httpwwwqika
comc
数据挖掘分析及其算法的应用
作者:霍畅刘亚丽董景园来源:《信息记录材料》2019年第01期
【摘要】在互联网“”和云计算背景下,时代飞速发展的同时积累了大量形式的数据,为了对急剧增长的数据进行处理,数据挖掘技术随之产生。本文总结了数据挖掘的基本理论和过程,并在此基础上分析了Apriori算法,然后对该算法在商业领域和医疗方面的应用进行了介绍。
【关键词】大数据;数据挖掘;Apriori算法
【中图分类号】TP274【文献标识码】A【文章编号】10095624(2019)01006602
1引言
随着互联网时代快速发展,人们在学习生活和工作中,很多方面都能产生大量不同的数据。在如此庞大的数据面前,如何快速高效地对数据进行分析处理已经成为大众所关注的焦点。本文介绍了一种较为高效的数据处理技术数据挖掘,主要从它的基本理论及其处理过程两方面进行了总结。此外,为了缓解数据挖掘的压力,还引入了具有关联规则的Apriori算法来改进该技术,然后讨论了该算法的一些应用。
2概述
21数据挖掘概念
数据挖掘(DataMi
i
g,DM),是在数据库研究发展中极其重要的一个环节,它目前是人工智能和云计算领域研究的热点,所谓数据挖掘就是在海量数据中提取出对用户来说具有价值意义的信息。广义上的过程是在某些研究数据中寻找一些模式的决策支持过程,基于人工智能、机器学习、统计学、数据库、可视化技术等,归纳推理分析数据并从中挖掘出潜在模式,以便用户做出更好的决策。1
12数据挖掘过程
通常来说,数据的挖掘过程分为四个主要阶段:问题设置、数据准备、挖掘操作、结果的证实与表达。
(1)问题设置阶段
f龙源期刊网httpwwwqika
comc
根据用户不同的需求,有针对性的设置问题,在一个大问题基础上逐步细化为一个个小问题,在可以进行数据挖掘之前,把这些问题落实到数据挖掘的任务中。
(2)数据准备阶段
①数据集成:解决数据语义歧义、处理缺失数据和清洗数据等问题。
②数据选择:主要是为了使选择出的数据更加精确并且提高所要挖掘的数据的质量。
③数据预处理:有利于打破目前数据挖掘工具的限制。
(3)挖掘操作阶段
此阶段进行实际挖掘操作。根据用户不同的数据挖掘需求,确定对应的挖掘方法,选择合适的工具,实现高效的数据挖掘。
(4)结果的证实与表达
最后得到的数据要依据用户的决策目的进行筛选过滤,提取最有价值的信息传达给用户。如果用户不满意,还需重复上面的数据挖掘过程。2
3Apriori算法分析
Apriori算法在数据r
好听全球资料 返回顶部