- · 《船舶标准化与质量》栏[06/30]
- · 《船舶标准化与质量》刊[06/30]
- · 《船舶标准化与质量》征[06/30]
- · 《船舶标准化与质量》投[06/30]
- · 《船舶标准化与质量》收[06/30]
知识图谱构建中的语义标准问题研究<sup>*</sup>(2)
作者:网站采编关键词:
摘要:一个领域的概念模型(本体论)[16]。 通过本体定义可以看出本体关键在于明确的、可形式化的共享概念模型规范说明,本体定义的核心是标准化的概念模型,
一个领域的概念模型(本体论)[16]。 通过本体定义可以看出本体关键在于明确的、可形式化的共享概念模型规范说明,本体定义的核心是标准化的概念模型,构成概念模型的基本要素是概念,因此,对本体的标准化其实质就是对概念的标准化。众所周知,概念作为知识单元一词最早源于亚里士多德的逻辑学,早在语言学时代,那里还将概念称之为“意义”。从术语学理论来讲,概念是由术语来指称的,因此,可以推论出:本体是由术语以及术语和术语间的关系组成。由此可见,对于本体的标准化,其实质就是对这些构成本体的术语、名称或词汇的标准化[20]。 1.1.2 本体分类 文献[5]和[21]对本体进行了分类,根据本体的用途将本体划分为4类,轻量级本体(Lightweight Ontologies)[22]、顶层级本体(Upper Ontologies)[23]、元数据应用方案(Application Profiles)即领域本体、元本体(Meta-ontologies)或本体语言(Ontology Languages)即表示本体的本体(Ontologies for Representing Ontologies)。本文将依据该分类法来构建标准体系模型,并对其中的词汇表进行分类,见第2节。 1.2数据语义与元数据 一般来讲,数据语义不仅包含数据本身含义,而且还包含数据间关系。数据语义可以由元数据来描述或定义,而本体对知识的建模或表示其实质就是将这些元数据词汇按照一定的关系组织在一起,从而清晰地表达数据间的复杂语义关系。从术语标准化科学角度讲,概念是由术语来指称的,而术语又是由元数据来定义的,因此,归根结底,本体表示知识的根本在于用标准化的元数据(术语)来间接地建模概念系统。 1.3知识图谱和关联数据 近几年,随着关联数据[23]等项目的全面展开,语义Web数据源的数量激增,大量RDF数据被发布。互联网正从仅包含网页和网页之间超链接的文档万维网(Document Web)转变成包含大量描述各种实体和实体之间丰富关系的数据万维网(Data Web)。正如Google的辛格博士在介绍知识图谱[24]时提到的:“The world is not made of strings,but is made of things”,知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符(Identifier)。每个属性—值对(Attribute-Value Pair,AVP)用来刻画实体的内在特性,而关系(Relation)用来连接两个实体,刻画它们之间的关联。知识图谱亦可被看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成,这个图模型可用W3C提出的资源描述框RDF[25]或属性图(Property Graph)[26]来表示。 1.4本体、关联数据及知识图谱间的关系 知识图谱由两个重要部分组成:模式层(Schema Level)和数据层或实例层(Data Level),如图1所示,知识图谱构建Schema相当于为其建立本体(Ontology),事实上,模式是对知识的提炼,有助于知识的标准化,更利于查询等后续处理。 图1 知识库图谱是由描述知识图谱的Schema和数据组成 2知识图谱语义标准化模型 结合文献[21]对本体的分类研究,并结合系统论思想,再加之笔者多年从事数据标准化的研究与深度思考,提出了知识图谱标准化体系模型系统,该系统是由相关的要素关联在一起形成的一个结构整体(见图2)。依据第1节中对本体的分类,现将知识图谱标准体系模型解构为五个层次,即元本体编码标准层、元本体规范层、顶层标准词汇表层、领域专题标准词汇表层以及领域元数据词汇表融合层。图2左侧是与具体领域相关的元数据标准和本体标准,右侧图包括公用的顶层标准和用来对本体形式化的W3C制定的元本体标准,它负责定义知识图谱的模式层。这五层标准体系模型间的关系是层层递进关系,即上层依赖于下层,下面给出每一层技术细节。 2.1元本体编码标准层 第一层是元本体编码标准,其编码标准由W3C制定,其中包括URI、UNICODE、XML、XML NS以及XML Schema规范等,该层规定了第二层元本体编码的系列规范。 2.2元本体规范层 第二层是元本体规范层,该层自底向上依次定义了RDF、RDFS和OWL元本体定义的形式化语言和标准词汇表,这几种元本体所描述的语义自底向上由弱到强。元本体规范为本体的序列化提供了标准支撑,元本体规范均由W3C来制定。 2.3顶层标准词汇表层 第三层是顶层标准词汇表,它又划分为两个子层,一个是顶层本体词汇表子层,诸如Dbpedia本体、cyc、MSO、FOAF、SKOS以及Schema.or
文章来源:《船舶标准化与质量》 网址: http://www.cbbzhyzl.cn/qikandaodu/2020/0630/336.html