摘要:
关于信息检索文献综述
作者:蒋亚宾
本文通过对信息检索的历史发展、现状分析以及发展趋势做出总结与分析,已达到对信息检索的更深层次的认识,并希望在信息检索方面对读者有所帮助。
关键词:信息检索、历史发展、搜索引擎、发展趋势
1、前言信息检索i
formatio
retrieval是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索i
formatio
storagea
dretrieval这是广义的信息检索。狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。相当于我们所说的信息查询i
formatio
search。根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索);根据检索对象、形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。本文通过对以往关于信息检索的文献进行综述,并从中总结出观点,达到对信息检索更深层次的认识。2、历史发展1950年,莫尔斯(Calvi
N.Mooers)首次提出信息检索(I
formatio
Retrieval)一词。其后,随着信息检索理论和实践的更新发展,人们对信息检索的认识也在不断深入。主要存在三种角度的认识:时间性通讯、信息处理和文献查找。从时间性通讯角度来看,通过信息检索得到了一些文献,从而使得著者与读者(信息检索的用户)之间建立起了一种通讯。从信息处理角度,信息检索的基本问题,是如何处理信息和信息的结构。从文献查找角度看,信息检索就是查找出含有用户所需信息的文献的过程。在信息检索领域,这是一种传统的主流观点。从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。最初的信息检索系统面向小型的科学文摘数据库、法律和商业文档。检索模型为基本的布尔模型和向量空间模型。Cor
ellU
iversity的ProfSalto
成为这个领域的先驱,著名的IR向量空间模型的创始人,开发了著名的SMART向量空间模型IR系统,并免费开放源代码,大大促进了IR的发展。80年代,IR技术出现在大型文档数据库中。90年代,可以在互联网上利用Archie对FTP服务器上的文档进行搜索。Archie是一个可搜索
第1页共5页
f的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。1994年4月,Sta
ford两名博士生,美籍华人JerryYa
g(杨致远)和DavidFilo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。1995年发布AltaVistar