全球旧事资料 分类
说,信息检索的范围与语义分析的程度息息相关,语义分析程度越充分,发现的知识单元越丰富,检索结果越全面、准确;反之,语义分析程度不够,能够发现和标记的知识单元就相对较少,检全率和检准率都会降低导致检索效率低下。212、212、语义分析的内容针对信息资源内容的语义分析包括两个方面:基于内容的定性分析和定量分析。基于内容的定性分析是对信息内容的学科属性进行分析和鉴定。通过语义分析,确定信息所属范畴,从而限定了信息检索的范围。目前定性分析的方法主要有专家法和机器学习法。基于内容的的定量分析是定量的分析信息资源之间的关系,通过对信息资源所含知识单元的数量特征、数量关系和数量发展进行统计分析,区分核心信息资源和一般信息资源的知识单元的差异。213、213、语义分析对检索效率的影响信息内容的定性分析能够分析和鉴定信息的学科属性,控制检索的语义范同,保证了能够检索出全部与特定学科内容相关的信息,剔除不相关的信息,提高了信息检索的检全率和检准率。信息内容的定量分析从数量的角度分析信息资源的相互关系,区分出核心信息资源和一般信息资源,使检索过程优先匹配核心信息
26
f资源,缩减平均匹配时间,提高检索效率。因此,信息资源的语义分析程度是影响信息检索效率的关键因素。22、22、检索模型信息检索模型是描述信息检索过程中文档表示,查询及其相互关系的模型。信息检索模型决定了查询过程的效率。目前主要的信息检索模型有布尔模型、向量空间模型、概念模型和基于本体的信息检索模型。221、221、布尔模型布尔模型是基于集合论和布尔代数的一种简单模型,该模型为用户提供了一个容易掌握的方式,输入布尔表达式即可查询。布尔模型定义索引术语只有两种状态:匹配和不匹配,这就导致了索引术语的权重都表现为二元性,要么文档完全匹配,要么文档完全不匹配,布尔模型只能进行精确检索而不能进行模糊检索。222、222、向量模型向量空间模型是利用空间相似性来表示语义的相似性。文档和查询都用多次元向量表示,如果查询向量和文档向量距离最近,那么这个文档和这个查询的相关度就最大,匹配程度就越高。向量空间模型解决了布尔模型索引术语权重二元性的缺点,提供出符合某向量距离即相关度数值范围内的所有检索结果,很大程度的提升了信息检索的检全率,但倘若相关度制定的过低,则会导致检索结果数量过多,影响检索效率。223、223、概率模型概率模型基于以下理论:r
好听全球资料 返回顶部