全球旧事资料 分类
佛山科学技术学院本科生毕业设计(论文)开题报告佛山科学技术学院本科生毕业设计(论文)
学院学生姓名选题机电与信息工程学院曾烁垲学号专业计算机科学与技术指导教师曾凡智
2006314227
INTERNET环境下web数据挖掘算法的研究与应用
选题的依据、意义、国内外现状及主要参考文献:随着I
ter
et的高速发展,万维网已经成为一个巨大的、分布广泛的和全球性的信息服务中心,是人们日常生活获得信息的重要平台。但是它是巨大的、多样的和动态变化的。从站点经营方面来说,他们需要根据用户的访问兴趣、访问频度、访问时间动态地调整页面结构,改进服务,开展有针对性的电子商务以更好地满足访问者的需求。从访问者来说,他们希望用最简洁的方式得到最精确地信息,希望得到个性化的服务。目前有许多基于索引的Web搜索引擎,它可以完成对Web的搜索,Web页面作索引,和建立和存储大量的基于关键字的索引,用于定位包含某关键字的Web页面。但是,目前基于关键字的搜索引擎仍存在一些问题。第一,对以任一的话题,都仍有海量内容且质量不高;第二,很多与话题相关的文档可能并不包含相关的关键字。这表明目前Web搜索引擎对Web资源的查找还存在缺陷,不能很好的满足人们的需要。数据挖掘(DataMi
i
g)技术是从网络文档或大量数据库的数据中自动发现和提取信息资源与知识的过程。所以在INTERNET环境下对web数据的挖掘对解决上述问题至关重要。主要参考文献:1JiaweiHa
Micheli
eKamber《数据挖掘概念与技术》机械工业出版社2Margare
tHDu
ham《数据挖掘教程》清华大学出版社3刘兵《Web数据挖掘》清华大学出版社4《计算机工程》等相关期刊5《计算机应用技术》期刊研究内容:本题目通过对数据挖掘中分类挖掘的典型算法例如神经网络算法等探讨,熟悉分类挖掘的内容、表示、方法,对相关的算法进行比较与改进。在了解Web文档结构与文档内容的基础上,把改进的算法应用在对Web文档的内容的进行分类分析,在此基础上形成算法的应用模块,并加以验证。
f研究方法、手段及步骤本课题的主要研究方法为神经网络分类法。以数据挖掘(DataMi
i
g)、信息检索(IR)、人工智能(AI)为基础的计算机应用技术作为研究手段,采用调查、研究、设计、编程实现等方法和手段的研究。第一阶段(1周4周):查阅资料,熟悉图象处理相关知识第二阶段(5周8周):概要设计、详细设计第三阶段(9周12周):编程实现第四阶段(12周16周):整理r
好听全球资料 返回顶部