21致谢21参考文献22英文翻译22
3.用ID3算法生成决策树5
ff数据挖掘中决策树算法的探讨及实现
学生姓名赵云鹏指导教师:梁晓玲
摘要:现代世界是一个驱动的世界,我们被数据所包围,数据挖掘技术变成了决策者们的热门话题,数据挖掘是当前涉及统计学、人工智能、数据库等热门学科的研究领域,数据挖掘是从数据中提取人们感兴趣的、隐藏的、可用的知识,并表示成人们可以理解的形式。决策树算法是数据挖掘中特别热门的领域,通过对数据挖掘中决策树的分类算法的学习,论文中用C语言实现了ID3算法。关键字:数据挖掘;决策树;算法;ID3正文引言目前,我们现在已经生活在一个网络化的时代,通信、计算机和网络技术正改变着整个人类和社会,我们的生活被大量的数据包围,我们如何从浩如烟海的数据中找出所需的信息来,供人们的特定需求使用,成了我们最难解决的问题之一,而此时数据挖掘应运而生,数据挖掘就是从大量的数据中挖掘出有用的信息。1概述11数据挖掘概述111定义数据挖掘(DataMi
i
g)就是对观测到的数据集(经常是庞大的、不完全的、有噪声的、模糊的、随机的)进行分析,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。112数据挖掘的功能数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能:1)自r