5.1 什么是知识图谱融合

优质
小牛编辑
138浏览
2023-12-01

知识图谱包含描述抽象知识的本体层和描述具体事实的实例层。本体层用于描述特定领域中的抽象概念、属性、公理;实例层用于描述具体的实体对象、实体间的关系,包含大量的事实和数据。一方面,本体虽然能解决特定应用中的知识共享问题,但事实上不可能构建出一个覆盖万事万物的统一本体,这不仅是因为世界知识的无限性决定构建这样的本体在工程上难以实施,更重要的是由于本体构建所具有的主观性和分布性特点决定了这种统一本体的构建无法得到一致的认可;此外,过于庞大的本体也往往难以维护和使用。在实际应用中,不同的用户和团体根据不同的应用需求和应用领域来构建或选择合适的本体。这样一来,即使在同一个领域内也往往存在着大量的本体。这些本体描述的内容在语义上往往重叠或关联,但使用的本体在表示语言和表示模型上却具有差异,这便造成了本体异构。在知识图谱应用中,为了获取其他应用所拥有的信息,或者联合多个应用以实现更强大的功能,不同应用系统之间的信息交互非常的普遍和频繁。然而,如果不同的系统采用的本体是异构的,它们之间的信息交互便无法正常进行。在实际的知识图谱应用中,本体异构造成了大量的信息交互问题。因此,解决本体异构、消除应用系统间的互操作障碍是很多知识图谱应用面临的关键问题之一。另一方面,知识图谱中的大量实例也存在异构问题,同名实例可能指代不同的实体,不同名实例可能指代同一个实体,大量的共指问题会给知识图谱的应用造成负面影响。因此,知识图谱应用还需要解决实例层的异构问题。

知识融合是解决知识图谱异构问题的有效途径。知识融合建立异构本体或异构实例之间的联系,从而使异构的知识图谱能相互沟通,实现它们之间的互操作。为了解决知识融合问题,首先需要分析造成本体异构和实例异构的原因,这是解决知识融合问题的基础。其次,还需要明确融合针对的具体对象,建立何种功能的映射,以及映射的复杂程度,这对于选择合适的融合方法非常重要。知识融合的核心问题在于映射的生成。目前的各种本体匹配和实例匹配使用的技术基本可归结为基于自然语言处理进行术语比较、基于本体结构进行匹配,以及基于实例的机器学习等几类;不同的技术在效果、效率以及适应的范围方面都有不同,综合使用多种方法或技术往往能提高映射的结果质量。