- · 《船舶标准化与质量》栏[06/30]
- · 《船舶标准化与质量》刊[06/30]
- · 《船舶标准化与质量》征[06/30]
- · 《船舶标准化与质量》投[06/30]
- · 《船舶标准化与质量》收[06/30]
知识图谱构建中的语义标准问题研究<sup>*</sup>(3)
作者:网站采编关键词:
摘要:g本体等。该层的另一个重要子层就是顶层元数据词汇表子层,该子层主要包括通用领域的一些元数据标准,诸如DC和DCMI等。在构建某个领域本体时,可以从
g本体等。该层的另一个重要子层就是顶层元数据词汇表子层,该子层主要包括通用领域的一些元数据标准,诸如DC和DCMI等。在构建某个领域本体时,可以从这两个子层抽取出符合领域应用的标准本体词汇与标准元数据词汇被领域所用,总之该层为领域构建本体提供了顶层或公共的标准词汇支撑。 图2 领域知识图谱构建应遵循的五层标准化体系模型 2.4领域专题标准词汇表层 第四层是领域专题标准词汇表层,包括领域专题本体词汇表和领域专题元数据词汇表。值得注意的是,在这里为什么没有将其称谓为“领域标准词汇表”,而用“专题”二字进行限定呢?根本原因在于:领域所包括的学科或专业可大可小,即这个领域可能大到学科,也可能小到某个专业中的一个主题,因此,本文将其称为专题词汇。领域专题本体词汇表子层又细分为领域本体词汇表和轻型本体词汇表两个子层。从图2中可以看出,自从语义Web规范提出以后,各个领域涌现出大量的领域事实上的本体词汇表标准,诸如图书情报领域的书目本体(BIBO)、社区语义网本体(SWRC)、医学、农业、生物、基因等大量领域专题本体标准词汇表等。轻型本体标准词汇表包括受控词汇表、分类法、叙词表和WordNet等,所谓轻型是指它们相对于本体而言的,因为它们所表达的语义有限,这些词表是伴随着检索的发展而诞生出来的,是以实现更加精准的检索为目的。这些轻型本体词汇表为领域本体的构建提供标准词汇。 本层还包括领域专题元数据词汇表标准,从理论上来讲,这个子层可以将当下及未来所有的领域元数据词汇表标准包括在内,但是在实际应用中,可以根据领域要求自行选择领域元数据词汇表标准。由于该模型是通用的,所以在这里列出许多领域的一些元数据词汇表标准。诸如图书情报领域的MARC元数据标准;医疗卫生领域的UMLS、ISNOMED、IMT;地理信息领域的FGDC/CSDGM以及教育领域的LOM系列元数据标准等。这些领域专题元数据均为各自领域专题本体的构建提供了元数据标准支撑。总之,该层为某个领域构建领域知识图谱提供了领域内一些特有的专有标准词汇表,这部分是构建领域专用知识图谱的主要标准词汇的来源,在应用中要优先选用这些标准。 2.5领域元数据词汇表融合层 领域元数据词汇表融合层主要实现对领域内各种元数据词汇表与本体词汇表中的各种元数据的统一融合、注册、维护、管理和使用的领域全部元数据标准,其中包括数据元素标准和概念模型标准,它是领域实现知识图谱标准化的根本。该标准是实现领域元数据标准化的核心,目前,许多国家都按照国际标准[7-14]建立了各自的标准,诸如IEEE依据ISO/IEC (MDR)标准,设计并开发了智能交通元数据注册系统ITSDR(Intelligent Transportation System Data Registry),这些交通领域元数据标准实现了全美国50多个州与地区的交通数据的交换与共享;美国国家环境信息处研发了环境元数据注册目录EDR(Environmental Information Office is Creating the Environmental Data Registry),这一标准实现了美国国家环境数据的高效交换与共享;还有澳大利亚的国家健康元数据注册标准;美国国家统计局的元数据注册标准;加拿大的统计集成元数据标准;除此之外,还有OASIS and XML.org XML元数据注册标准等。在国际上采用ISO/IEC 标准建立领域元数据注册标准的项目不胜枚举。但是,国内真正完全按照ISO/IEC 标准构建元数据注册标准的领域还是不多。 由此可见,通过知识图谱标准体系模型可知:知识图谱标准化核心在于元本体层面和领域元数据标准词汇表层面,然而元本体层面的标准化已经由W3C制定,直接应用即可。在这里,需要我们做的就是做好领域的元数据标准,再结合标准体系提供的标准词汇表就可以构建出标准化的领域知识图谱。 3实现标准化的知识图谱构建流程 通过对五层标准体系模型的研究可以看出第五层是站在整个领域的全局来考虑领域的语义数据标准化问题,其实该层是第三层和第四层,再加之领域内特有的元数据标准统一融合而形成的一个全面的领域语义数据标准。但遗憾的是,目前领域内还没有一个覆盖全面的领域语义数据标准,这是未来领域要努力研究并解决的问题。所以在进行领域知识图谱构建过程中,当下也只能依据第三和第四层的词汇标准进行领域知识图谱的构建,并采用第一、二层进行知识的表示。 在传统的知识图谱构建流程中只要增加标准化的环节即可,下面给出构建领域知识图谱的流程,可根据构建的方式将它划分为间接式和直接式。 3.1间接式构建流程 利用领域标准词汇表,包括顶层和领域标准词汇表以及领域元数据词汇表融合作为输入。在构建领域知识图谱过程中,无论是采用手动、半自动或自动化构建,对于顶
文章来源:《船舶标准化与质量》 网址: http://www.cbbzhyzl.cn/qikandaodu/2020/0630/336.html