,数据挖掘市场份额正日益扩大,越来越多的企业开始利用数据挖掘来分析信息系统中所积累的数据,以辅助决策,数据挖掘已逐渐成为他们在市场竞争中立于不败之地的法宝。本课题主要是为满足工作中的数据分析决策需要,对数据库中部分值得研究的水量和水费信息进行提取,建立与自来水企业业务相适应的数据仓库,并通过对数据仓库中的信息的分析和数据挖掘,提取有价值或者过往没有发现的信息,为企业决策提供指导。
三国内外研究现状
1数据仓库技术对数据的处理分为两类:操作型处理与分析型处理。操作型处理也称为联机事务处理(OLTP,是指对企业数据进行日常的业务处理,这类处理主要是对企业数据库的一个或一批记录的查询、更新或删除操作。分析性处理则主要用于管理人员的决策分析,通过对大量数据的综合、统计和分析得出有利于企业决策的信息。在以往的数据库设计中,通常是面向应用,以数据库为中心,数据库的设计与开发都是以OLTP为基础的,所以数据分析的结果并不是很理想,因此将操作型数据环境和分析型数据环境分离是很有必要的。数据仓库从数据库中发展而来,加入了数据分析的功能,弥补了许多传统数据库的不足。数据仓库最大用途是提供给决策者一种全新的方式从宏观或微观的角度来观察多年累积的数据,从而使决策者可以迅速地掌握自己企业的经营状况、利润分布等对企业发展和决策有重要意义的信息,
4
f以利于做出更加准确、科学的决策数据仓库创始人WHI
mo
是这样定义数据仓库的:数据仓库是面向主题的、集成的、时变的、非易失的数据集合,用以支持管理决策。自从数据仓库的概念提出以后,它就在飞速地发展。数据仓库不是简单的对数据进行存储,而是对数据进行再组织,它的目的是要建立一种体系化的信息存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的数据转换成集成的、统一的数据,不同用户通过运用其中的数据进行分析,发现新的问题、新的想法、进而开发出行之有效的决策系统。数据仓库技术在近几年蓬勃发展起来,不少厂商都推出了他们的数据仓库产品,同时也推出了一些分析工具。仅仅拥有数据仓库是不够的,在其上应用各种工具进行分析,才能使数据仓库真正发挥作用,联机分析处理和数据挖掘就是这样的分析工具。2数据挖掘技术数据挖掘技术挖掘数据挖掘的基本思想是从数据中抽取有价值的信息,其目的是寻找数据间潜在的关联,发现被忽略的要素,并形成可以理解的规则等,供决r