全球旧事资料 分类
龙源期刊网httpwwwqika
comc
知识图谱数据管理系统的设计与实现
作者:王丽娟吴刚来源:《电子技术与软件工程》2016年第24期
本文在调研考察了多种图数据库的基础上,综合考量了分布式、扩展性、可用性、查询语言、容错性、存储后端、一致性等因素,并充分结合知识图谱数据自身所具有的特点,选取了当前流行的图数据库系统Tita
作为底层存储,并对其进行进一步深入的研究,在此基础上实现了一个知识图谱数据管理系统。此系统能对知识图谱数据进行管理,包括数据的导入、数据的查询以及数据的修改,能支持billio
数据量的存储,以及图上的基本操作,这些操作响应时间都在秒级。
【关键词】大数据大图知识图谱图数据库
1绪论
知识图谱是一种知识数据的管理方式,通过语义检索技术获取并有机整合多源数据,用于提高搜索引擎的质量。知识图谱本质上是一种语义网络。其结点代表实体(e
tity)或者概念(co
cept),边代表实体概念之间的各种语义关系。知识图谱在语义搜索、智能问答、知识工程、数据挖掘等领域有着广泛的应用。考虑到知识图谱所具有的大规模、图结构等特点,研究知识图谱数据的高效存储,检索,以及展示等问题具有重要的实际意义和应用价值。
图数据库是一种NoSql数据库。采用图数据库的原因很简单,因为知识图谱具有大规模、图结构等特点。图是关系的子集,它能够转化成关系模型,然而通用的关系模型对将图结构拆分成顶点、边、属性这些表,使得简单的图遍历成为开销巨大的joi
操作,同时也丢失了图结构的整体性。而图数据库的扩展性和灵活性非常好,适合用于复杂关系管理和关系查询推理。多数图数据库提供了适合表达图结构和图查询的查询语言,有利于对图的遍历查询,而且效率高。图数据库在处理这类数据上具有巨大的优势。
2相关技术介绍
21RDF简介
资源描述框架是由W3C提出的一种数据模型,已经成为语义网领域存储关联数据的推荐标准。RDF提供了一种用于描述信息、使得信息能够在应用程序间不失语义地交换的通用框架。在RDF框架下,数据被描述成主体(subject)、谓词(predicate)和客体(object)。RDF中的数据可以是资源描述符、文字或是空节点。
22图数据库
f龙源期刊网httpwwwqika
comc
本文实现的系统基于图数据库。图数据库使用图结构来存储和查询数据,其基本存储单元是:节点、边(也可以称为关系)、属性。图数据库与关系型数据库的一个明显的区别是使用边来连接各个节点,而不是外键。
23Tita
图数据库介绍
Tita
是一个分布式r
好听全球资料 返回顶部