全球旧事资料 分类
策者进行分析和决策。数据挖掘技术现有分类、聚类、关联分析、异常检测几大类,研究方向包括以下几大类型:神经元网络技术、决策树、进化式程序设计、遗传算法和非线性回归等。在国外,数据挖掘技术已经广泛的应用于零售、证券、电信、航空、保险、石化、能源、交通、银行等领域,近年来计算机的普及又促进了数据挖掘在快速消费品、电子商务行业甚至社会科学等领域的发展。利用数据挖掘技术识别客户的购买行为模式,对客户进行分析;对银行或商业上经常发生的诈骗行为进行预测,都是经典的应用。数据挖掘技术汇集了来自机器学习、模式识别、数据库、统计学以及管理信息系统等学科的成果。多学科的相互交融和相互促进,使得数据挖掘这一新学科得以蓬勃发展。在国内,数据挖掘也在很多行业内推广,虽然未必是复杂的应用,但都对企业的决策分析提供帮助。例如在自来水行业中,有对故障损坏的水表信息进行数据挖掘,根据用水类别、水表品牌、水表口径、水表使用的时间长短来进行关联分析,找出其中的规律,对今后企业的运营提供决策上的支持。除此之外,在供电行业可以对供电量数据进行趋势分析,保证高峰用电安全;在证券行业,根据客户的投资记录,分析客户的操作习惯和风险偏好,提供适合的投资产品。
四主要研究内容
1数据仓库的设计和建立建立数据仓库是为数据分析和数据挖掘服务的,建立水量水费数据仓库必须要结合水量水费的数据特点,确定源数据库哪些表和数据需要抽取,以及抽取的方法和策略,把历史数据重新组织。水量水费数据仓库的设计包括概念模型设计、逻辑模型设计和物理模型设计。概念模型设计数据仓库的概念模型设计即是选定分析主题域,界定系统边界,按照分析要求确定主题域的公共键码、联系以及属性组,然后分析原有业务系统的数据组织、分布等,形成关于主
5
f题域的完整概念模型。水量水费数据主要取自于自来水企业现有的营业收费管理系统,其数据库是数据仓库源数据抽取和转换的主要对象。根据分析的需求,建立水量和水费两个主题。逻辑模型的设计数据仓库的逻辑模型描述了数据仓库主题的逻辑实现,也就是每个主题所对应的关系表的关系模式定义,是数据仓库由概念模型到物理模型转换的桥梁。数据仓库是建立在关系数据库基础上的,因此在数据仓库的设计中采用的逻辑模型就是关系模型。关系模型概念简单、清晰,用户易懂、易用,有严格的数学基础和在此基础上发展的关系数据库理论。利用关系模型可以创建星型模r
好听全球资料 返回顶部