索引擎只是能够在关键词的布尔连接之间提供帮助,但是例如SQL语言之类较为复杂的搜索不能提供给相关用户。2)在增量检索方面没有研究目前的搜索引擎在增量检索方面还缺乏发展,只能够对检索信息从新开始,而不能将用户曾经的检索过的信息进一步提炼,以达到更加准确的程度。3)只能提供关键词搜索目前广泛使用的关键词搜索不能更好的满足用户的需求,关键词搜索仅仅只是简单的关键词匹配和检索。不能智能化的用语言交流,来达到检索的目的。4)搜索引擎单一面对当前海量的网络资源,单个搜索引擎的力量以及数据库的容量都对搜索能力的范围有所限制,而且不同的搜索引擎之间存在着许多相同的信息。212搜索引擎的关键技术1)排序信息和集成信息目前用户利用搜索引擎检索信息时,一般会反馈得到相关文档的摘要。许多搜索引擎会通过自动摘要的功能选择性抽词。这种方法准确度不高。人们可以利用Web的内容挖掘当中的对文本进行归纳的相关技术,也就是说利用Web文档的内容而不是根据某些词的位置来检索信息。对于PageRa
k算法,就是搜索引擎首先是检索提问,之后再将检索得到的结果进行页面的分析15,得到页面的相关等级,然后依据页面对检索结果的重要性进行输出。全球著名的搜索引擎Google就是采用了这个技术才使得其检索结果准确度高。类似的算法还有Authoritya
dHub16。2)识别搜索条件对搜索条件进行识别含有以下两个方面:一是对查询条件当中的有效成分进行提取;
5
f河南师范大学本科毕业论文
二是依据知识的数据库对所针对的关键词的相关词,如近义词或同义词进行提取。假设搜索引擎在对一个关系复杂的查询进行检索时,若简单的使用自然语言不做替换或提取有效成分,则很难得到预期的结果。所以说,建立一种有效的检索机制对提高检索准确度至关重要。3)个性化搜索引擎个性是每个人的特征,追求个性是每个人的基本心理。搜索引擎与个性相结合,将更加能够得到用户的青睐。开发个性化的搜索引擎的首要前提就是能够准确的获知用户的兴趣爱好。通常为得知用户的兴趣爱好的方法就是根据用户的检索关键词、浏览的网页、书签文件、以及用户的动态更新等等。22智能化Web浏览器随着互联网的发展,信息资源也越来越丰富,传统的Web浏览器在应对用户需求时,可能难以应对。此时智能化的Web浏览器才能让用户需求得到更好的满足。221传统的Web浏览器存在的不足:1不能满足用户的个性化要求;传统的Web浏览器接受用户的需求之后r