全球旧事资料 分类
龙源期刊网httpwwwqika
comc
数据挖掘研究综述
作者:王栋来源:《数字技术与应用》2014年第02期
摘要:大数据时代,所有企业都将由数据驱动,数据将成为企业和公共组织的重要资产。同时,企业更需要高效的大数据工具,让数据资产产生真正的价值。数据挖掘就是运用数据库、人工智能和数理统计等多方面技术从大量的实际应用数据中提取隐含信息和知识的过程,通过高度自动化地分析企业数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
关键词:数据挖掘大数据市场营销企业决策
中图分类号:TP31113文献标识码:A文章编号:10079416(2014)02008002
数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题。数据挖掘己广泛地应用到社会的各个领域和行业,如商业领域中的客户关系、产品生产、市场营销等;金融领域中的股票交易市场、投资评估等;天文学领域的气象预报、气象灾害预测等;教育领域的高校学生管理、高校毕业生就业分析、高校教学质量的评估等。可以说,数据挖掘实是处在知识创造过程中最核心的位置,因此做好数据挖掘工作具有十分重要的意义。
1数据挖掘的定义和本质
对于数据挖掘一般有两种定义,从广义上讲,数据挖掘,又称数据库中的知识发现,是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,就是从大型数据集中挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。从狭义上讲,数据挖掘则是指从特定形式的数据集中提炼知识的过程。
数据挖掘的本质是很偶然的发现非预期但很有价值的信息。这说明数据挖掘过程本质上是实验性的。数据挖掘的一个特定属性就是要处理的是一个大数据集。这就意味着,由于可行性的原因,我们常常得到的只是一个样本,但是需要描述样本取自的那个大数据集。数据挖掘所得到的信息应具有先前未知、有效和实用三个特征。
2数据挖掘的发展背景
f龙源期刊网httpwwwqika
comc
在这个信息爆炸的时代,如何从信息的汪洋大海中发现及时有用的知识,提高信息利用率呢?要想使数据真正r
好听全球资料 返回顶部