- · 《船舶标准化与质量》栏[06/30]
- · 《船舶标准化与质量》刊[06/30]
- · 《船舶标准化与质量》征[06/30]
- · 《船舶标准化与质量》投[06/30]
- · 《船舶标准化与质量》收[06/30]
知识图谱构建中的语义标准问题研究<sup>*</sup>(8)
作者:网站采编关键词:
摘要:构成,这个图模型可用W3C提出的资源描述框RDF[25]或属性图(Property Graph)[26]来表示。1.4本体、关联数据及知识图谱间的关系知识图谱由两个重要部分组成:模
构成,这个图模型可用W3C提出的资源描述框RDF[25]或属性图(Property Graph)[26]来表示。1.4本体、关联数据及知识图谱间的关系知识图谱由两个重要部分组成:模式层(Schema Level)和数据层或实例层(Data Level),如图1所示,知识图谱构建Schema相当于为其建立本体(Ontology),事实上,模式是对知识的提炼,有助于知识的标准化,更利于查询等后续处理。图1 知识库图谱是由描述知识图谱的Schema和数据组成2知识图谱语义标准化模型结合文献[21]对本体的分类研究,并结合系统论思想,再加之笔者多年从事数据标准化的研究与深度思考,提出了知识图谱标准化体系模型系统,该系统是由相关的要素关联在一起形成的一个结构整体(见图2)。依据第1节中对本体的分类,现将知识图谱标准体系模型解构为五个层次,即元本体编码标准层、元本体规范层、顶层标准词汇表层、领域专题标准词汇表层以及领域元数据词汇表融合层。图2左侧是与具体领域相关的元数据标准和本体标准,右侧图包括公用的顶层标准和用来对本体形式化的W3C制定的元本体标准,它负责定义知识图谱的模式层。这五层标准体系模型间的关系是层层递进关系,即上层依赖于下层,下面给出每一层技术细节。2.1元本体编码标准层第一层是元本体编码标准,其编码标准由W3C制定,其中包括URI、UNICODE、XML、XML NS以及XML Schema规范等,该层规定了第二层元本体编码的系列规范。2.2元本体规范层第二层是元本体规范层,该层自底向上依次定义了RDF、RDFS和OWL元本体定义的形式化语言和标准词汇表,这几种元本体所描述的语义自底向上由弱到强。元本体规范为本体的序列化提供了标准支撑,元本体规范均由W3C来制定。2.3顶层标准词汇表层第三层是顶层标准词汇表,它又划分为两个子层,一个是顶层本体词汇表子层,诸如Dbpedia本体、cyc、MSO、FOAF、SKOS以及Schema.org本体等。该层的另一个重要子层就是顶层元数据词汇表子层,该子层主要包括通用领域的一些元数据标准,诸如DC和DCMI等。在构建某个领域本体时,可以从这两个子层抽取出符合领域应用的标准本体词汇与标准元数据词汇被领域所用,总之该层为领域构建本体提供了顶层或公共的标准词汇支撑。图2 领域知识图谱构建应遵循的五层标准化体系模型2.4领域专题标准词汇表层第四层是领域专题标准词汇表层,包括领域专题本体词汇表和领域专题元数据词汇表。值得注意的是,在这里为什么没有将其称谓为“领域标准词汇表”,而用“专题”二字进行限定呢?根本原因在于:领域所包括的学科或专业可大可小,即这个领域可能大到学科,也可能小到某个专业中的一个主题,因此,本文将其称为专题词汇。领域专题本体词汇表子层又细分为领域本体词汇表和轻型本体词汇表两个子层。从图2中可以看出,自从语义Web规范提出以后,各个领域涌现出大量的领域事实上的本体词汇表标准,诸如图书情报领域的书目本体(BIBO)、社区语义网本体(SWRC)、医学、农业、生物、基因等大量领域专题本体标准词汇表等。轻型本体标准词汇表包括受控词汇表、分类法、叙词表和WordNet等,所谓轻型是指它们相对于本体而言的,因为它们所表达的语义有限,这些词表是伴随着检索的发展而诞生出来的,是以实现更加精准的检索为目的。这些轻型本体词汇表为领域本体的构建提供标准词汇。本层还包括领域专题元数据词汇表标准,从理论上来讲,这个子层可以将当下及未来所有的领域元数据词汇表标准包括在内,但是在实际应用中,可以根据领域要求自行选择领域元数据词汇表标准。由于该模型是通用的,所以在这里列出许多领域的一些元数据词汇表标准。诸如图书情报领域的MARC元数据标准;医疗卫生领域的UMLS、ISNOMED、IMT;地理信息领域的FGDC/CSDGM以及教育领域的LOM系列元数据标准等。这些领域专题元数据均为各自领域专题本体的构建提供了元数据标准支撑。总之,该层为某个领域构建领域知识图谱提供了领域内一些特有的专有标准词汇表,这部分是构建领域专用知识图谱的主要标准词汇的来源,在应用中要优先选用这些标准。2.5领域元数据词汇表融合层领域元数据词汇表融合层主要实现对领域内各种元数据词汇表与本体词汇表中的各种元数据的统一融合、注册、维护、管理和使用的领域全部元数据标准,其中包括数据元素标准和概念模型标准,它是领域实现知识图谱标准化的根本。该标准是实现领域元数据标准化的核心,目前,许多国家都按照国际标准[7-14]建立了各自的标准,诸如IEEE依据ISO/IEC (MDR)标准,设计并开发了智能交通元数据注册系统ITSDR(Intelligent Transportation System Data Registry),这些交通领域元数据标准实现了全美
文章来源:《船舶标准化与质量》 网址: http://www.cbbzhyzl.cn/qikandaodu/2020/0630/336.html