第3章 知识存储

优质
小牛编辑
112浏览
2023-12-01

王鑫 天津大学

随着知识图谱规模的日益增长,数据管理愈加重要。一方面,以文件形式保存的知识图谱显然无法满足用户的查询、检索、推理、分析及各种应用需求;另一方面,传统数据库的关系模型与知识图谱的图模型之间存在显著差异,关系数据库无法有效地管理大规模知识图谱数据。为了更好地进行三元组数据的存储,语义万维网领域发展出专门存储RDF 数据的三元组库;数据库领域发展出用于管理属性图的图数据库。虽然目前没有一种数据库系统被公认为具有主导地位的知识图谱数据库,但可以预见,随着三元组库和图数据库的相互融合发展,知识图谱的存储和数据管理手段将愈加丰富和强大。本章首先介绍图数据模型和图查询语言等基本知识;以演示操作的方式讲解各种主流知识图谱数据库,包括基于关系数据库的存储方案、面向 RDF 的三元组数据库和原生图数据库;以图数据库Neo4j为例介绍图模型数据的底层存储细节,同时梳理图数据索引和查询处理等关键技术;最后,以Apache Jena为例,针对知识图谱数据库开源工具进行实践。