,它是网上最早的爬行搜索引擎。AltaVista搜索技术从纯文本搜索技术开始,到1997年,其搜索能力扩展到25种语言搜索;1999年开始多媒体文件的搜索;2001年首次推出网上免费新闻搜索,2003年AltaVista被Overture收购。以雅虎初期为代表的第一代搜索引擎以人工目录分类为基础的网站搜索开辟了一个时代。第一代搜索引擎指主要依靠人工分拣的分类目录搜索,这种方式是被动的搜索,更新慢、搜索能力不足。
3、现状分析如今最主要的信息检索是网络信息检索。网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。
但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。(1)随着网页数量的迅猛增加人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索返回的信息数量之大让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量重复某些关键字使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位但事实上却可能没有提供任何对用户有价值的信息。(3)网络信息日新月异的变更人们总是期望挑出最新的信息。然而网络信息时刻变动实时搜索几乎不可能,就是刚刚浏览过的网页也随时都有更新、过期、删除的可能。
随着网上信息资源的膨胀发展,一种搜索引擎,无论它多么完美都不可能满足一个人所有的检索需求。如果遇到文献普查、专题查询、新闻调查与溯源、软件及mp3下载地址搜
第2页共5页
f索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。为解决注意登陆各搜索引擎,在各搜索引擎中分别多次输入同一检索请求(检索字串)等繁琐操作,于是基于网络检索工具诞生了。目前r