决实际问题的能力。(3)有利于发展大学生的组织协调能力和创新意识。各种种类繁多的比赛没有课堂教学太多的束缚和校园生活的限制,学生们的积极性被充分调动起来,兴趣高涨,思维也空前的活跃起来,往往会产生一些创造性火花,在实践中勇于开拓、敢于创新。(4)有利于提高大学生个人素养,完善个性品质。在比赛中的困难和危险面前,要求大学生们具有一定的牺牲精神和坚强的品质。赛事活动多了,并且能深入下去,大学生在积极参与的过程中,就会逐渐养成坚韧、顽强的优良品性,养成务实的学习态度和生活作风,不断提高自己、完善自己。
13本文的组织
论文正文包括四章:引言、系统相关技术、比赛信息集成系统的分析与设计、系统模块的设计与实现。第1章为绪论,分为3节,主要介绍系统的开发背景、系统的开发目标及研究内容及本文的组织。第2章为系统相关技术,分为2节,主要介绍系统相关技术:爬虫技术功能、页面解析的功能、以及信息筛选及录入的功能等的前提下进行介绍的,运
2
f第1章引言
用了heritrix、htmlparser、javaio、java技术等实现。第3章为比赛信息集成系统的分析与设计,分4节,包括系统模块设计,功能需求,数据需求,数据库设计。第4章为个人模块设计与实现,分4节,包括比赛信息系统的爬虫模块、页面解析文本信息入库模块,以及信息筛选上传、信息查看删除的模块的设计。
3
f第2章相关技术简介
第2章相关技术简介
21系统开发平台及开发工具
硬件环境个人PC、电网、电信网络等。软件环境MyEclipse80、Apache、Tomcat55。相关技术Htmldivcssjavascript爬虫heritrix;页面解析技术:
htmlparser;数据库sql;struts2模式。相关工具:MicrosoftSQLServer2005、Macromediadreamweaver8、MyEclipse80。
22工具和编程语言
在比赛信息集成系统中,运用了javasqlheritrixhtmlparser等技术。其中后台主要运用了heritrix爬虫技术。首先,Heritrix1是一个纯由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。它来自于wwwarchiveorg。Heritrix最出色之处在于它的可扩展性,开发者可以扩展它的各个组件,来实现个性的抓取逻辑,比赛信息系统利用它实现更多赛事信息的全网爬取,取得更多的大学生赛事资源。其次,Java23语言是一种功能强大的编程语言,负责heritrix应用的业务逻辑的实现和对应用程序进行控制。再次,Htmlparser是一个纯的java写的html(标准通用标记语言下的一个应用)解析的库,它不依赖于其它的java库文件,主要用于r