全球旧事资料 分类
龙源期刊网httpwwwqika
comc
基于JAVA的搜索引擎的设计与实现
作者:杨烁任晓菲来源:《科技创新与应用》2015年第21期
摘要:在浩瀚无边的网络资源中,特别是院校等自建网站的大型单位中,信息检索是一件很困难的工作,而建立搜索引擎显得尤为重要。文章阐述在广域网或局域网下建立信息检索的技术描述,从四个方面进行系统分析。为了使大家加深对信息检索的理解,从原理上解释从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条结果进行建立索引。然后通过Web服务器接受客户端请求后,将关键字用ICTCLASdll中文切词工具进行切割,将关键字列表在索引中搜索出所匹配的结果,并将其显示给客户。此外,还利用Ajax等一些技术增加了一些自动提示的效果,使得搜索界面更加人性化。
关键词:搜索引擎;网络蜘蛛;Luce
e;中文切词
引言
面对浩瀚的网络资源,各区间之间达到资源共享,为尽快达到用户索取资源的目的性而建立搜索引擎,毫不夸张的说所有的用户都可以从搜索出发到达自己想去的网上任何一个地方。伴随着网络的发展,搜索引擎主要经历了三个发展时期。从1994年初始,在“求全”的基础上开展应用,反应速率较慢。从1966年出现分布式方案,采取机器抓取技术,大大提高了检索速度。在2000年左右,在改进二代技术基础上,增加了互动性和个性化,采用自动分类、自动聚类、区域智能识别等技术,成为当今主流搜索引擎技术,提高用户应用效率。
1搜索引擎的结构
11搜索引擎系统概述
搜索引擎是根据用户的查询请求,按照一定算法从索引数据中查找信息返回给用户。为了保证用户查找信息的精度和新鲜度,搜索引擎需要建立并维护一个庞大的索引数据库。一般的搜索引擎由网络机器人程序、索引与搜索程序、索引数据库等部分组成。
网络机器人程序建立Luce
e索引从SQL中搜索信息Tomcat服务器Luce
e索引数据库浏览器JSP网络机器人程序、文档网络、机器人程序,建立Luce
e索引从SQL中搜索信息Tomcat服务器Luce
e索引数据库浏览的机器人程序系统结构图。
12搜索引擎的构成
搜索引擎的工作原理主要指输入一定规则,在相应的数据中抓取存储,进行预处理,组织排名调用索引库数据获取信息。
f龙源期刊网httpwwwqika
comc
121网络蜘蛛
网络蜘蛛也称为“网络机器人”(Spider),用Myeclipse、MysqL开发,采用Spri
gStrutsHiber
ate框架构成的系统。
122索引与搜索
采用索引技术,采用NONCLUSTERED方法,生成关键词到URL,并以特定数据结构存储在方式。高度注意提高信r
好听全球资料 返回顶部