领域知识图谱的构建和智能应用文献综述

 2023-08-04 06:08
  1. 文献综述(或调研报告):
    1. 知识图谱研究背景及分层架构

基于图的知识表示已经研究了数十年,而知识图谱这个术语并不是一项新技术。它是谷歌重新发明的一个定义,是谷歌用于增强其搜索引擎功能的知识库,是一种揭示了实体之间关系的语义网络,被其他公司和学术界用来描述不同的知识库或知识表示应用程序。在文献[1]中,作者提出了知识图谱的重定义,以促进对该领域进一步工作的探讨和共识,并将知识图谱与类似的结构进行界定和区分,表明了从完全手工制作的知识库到自动提取和处理的知识图谱,知识表示应用程序的构建方式存在本质差异。因此,知识图谱不适用于描述所有这些应用,因此应更谨慎地使用。类似的应用程序不必称为知识图谱,因为术语知识库和本体论可以充分,准确地描述它们。考虑到各种应用,知识图谱与数学框架相比,更类似于抽象框架。人们研究的重点应该针对现有知识图谱的定义进行深入分析,评估知识图谱及其访问源中的数据质量。[1]

构建知识图谱主要的目的是获取大量让计算机可读的知识。在互联网飞速发展的今天,知识大量存在于非结构化的文本数据、大量半结构化的表格和网页以及生产系统的结构化数据中。

知识图谱由数据层(data layer)和模式层(schema layer)两部分构成[12].

文献[12]中介绍了知识图谱的逻辑结构。其中,逻辑结构中模式层是知识图谱的概念模型和逻辑基础,对数据层进行规范约束。如果不需支持推理,则知识图谱可以只有数据层而没有模式层。在知识图谱的模式层,节点表示本体概念,边表示概念间的关系。在数据层,事实以“实体-关系-实体”或“实体-属性-属性值”的三元组存储,形成一个图状知识库。其中,实体是知识图谱的基本元素,指具体的人名、组织机构名、地名、日期、时间等。关系是两个实体之间的语义关系,是模式层所定义关系的实例。属性是对实体的说明,是实体与属性值之间的映射关系。属性可视为实体与属性值之间的hasValue关系,从而也转化为以“实体-关系-实体”的三元组存储。在知识图谱的数据层,节点表示实体,边表示实体间关系或实体的属性。

文献[9]中详细介绍了知识图谱的构建方法。主要有自底向上(如图1)与自顶向下(如图2)两种构建方式(在文献[9]中还提到了混合构建方式,由于模式层构建难度大而不常使用)自顶向下指的是先为知识图谱定义好本体与数据模式,再将实体加入到知识库。而自底向上指的是从一些开放连接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。

(图1 自底向上知识图谱构建流程)

(图2 自顶向下知识图谱构建流程)

目前,大多数知识图谱都采用自底向上的方式进行构建,其中最典型的就是Google的Knowledge Vault[3],在文献[3]介绍一种网络规模的知识概率融合方法中提出。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。