- · 《船舶标准化与质量》栏[06/30]
- · 《船舶标准化与质量》刊[06/30]
- · 《船舶标准化与质量》征[06/30]
- · 《船舶标准化与质量》投[06/30]
- · 《船舶标准化与质量》收[06/30]
知识图谱构建中的语义标准问题研究<sup>*</sup>(9)
作者:网站采编关键词:
摘要:国50多个州与地区的交通数据的交换与共享;美国国家环境信息处研发了环境元数据注册目录EDR(Environmental Information Office is Creating the Environmental Data Registr
国50多个州与地区的交通数据的交换与共享;美国国家环境信息处研发了环境元数据注册目录EDR(Environmental Information Office is Creating the Environmental Data Registry),这一标准实现了美国国家环境数据的高效交换与共享;还有澳大利亚的国家健康元数据注册标准;美国国家统计局的元数据注册标准;加拿大的统计集成元数据标准;除此之外,还有OASIS and XML.org XML元数据注册标准等。在国际上采用ISO/IEC 标准建立领域元数据注册标准的项目不胜枚举。但是,国内真正完全按照ISO/IEC 标准构建元数据注册标准的领域还是不多。由此可见,通过知识图谱标准体系模型可知:知识图谱标准化核心在于元本体层面和领域元数据标准词汇表层面,然而元本体层面的标准化已经由W3C制定,直接应用即可。在这里,需要我们做的就是做好领域的元数据标准,再结合标准体系提供的标准词汇表就可以构建出标准化的领域知识图谱。3实现标准化的知识图谱构建流程通过对五层标准体系模型的研究可以看出第五层是站在整个领域的全局来考虑领域的语义数据标准化问题,其实该层是第三层和第四层,再加之领域内特有的元数据标准统一融合而形成的一个全面的领域语义数据标准。但遗憾的是,目前领域内还没有一个覆盖全面的领域语义数据标准,这是未来领域要努力研究并解决的问题。所以在进行领域知识图谱构建过程中,当下也只能依据第三和第四层的词汇标准进行领域知识图谱的构建,并采用第一、二层进行知识的表示。在传统的知识图谱构建流程中只要增加标准化的环节即可,下面给出构建领域知识图谱的流程,可根据构建的方式将它划分为间接式和直接式。3.1间接式构建流程利用领域标准词汇表,包括顶层和领域标准词汇表以及领域元数据词汇表融合作为输入。在构建领域知识图谱过程中,无论是采用手动、半自动或自动化构建,对于顶层标准化词汇表中已经存在的本体,都直接融合到待构建的本体中来;如果顶层词汇表中没有对应的本体,那么就到领域专题标准词汇表中查找有没有对应的本体,如果有,就直接融合到待构建的知识图谱中来;如果在两个标准化词表中均找不到可用的本体,那么可以在两个词汇表中去查找有没有可替代的现成的元数据,如果有,则可以直接采用。对于本体中的层次关系的构建,可以到依据五层模型中的轻型本体词汇表定义的关系去建立知识图谱的各种关系,如属、分等关系。最后通过元本体规范对所构造的本体进行实例化,建构出领域知识图谱。3.2直接式构建知识图谱流程假如未来领域全部的语义词汇标准已经注册到MDR中,那么在构建领域的知识图谱时,可以直接依据MDR构建。首先将领域标准词汇表,包括顶层和领域标准词汇表,采用建构主义理论,依据MDR数据元素和概念系统模型注册规范将其注册到领域元数据词汇表融合模型中。经过注册的这些标准作为领域的稳定标准,再依据领域具体专业的需求,可以直接依据ISO/IEC -6标准自动生成本体,最后结合领域的实际数据对该本体实例化,建构出知识图谱。间接式构建知识图谱在本文中不做深入研究。总之,通过这个过程可以实现标准知识图谱的建构。4在石油术语知识图谱构建中标准应用实例图3 石油领域文献资源与石油术语关系知识图谱图4 石油钻井专业领域术语知识图谱本文以正在实施的石油领域石油术语知识图谱构建项目为背景,对所提出的五层标准体系模型的正确性、合理性进行验证,最后构建了集国际与国内多标准融合为一体的标准化石油术语知识图谱。利用3.1节中的知识图谱标准化流程,实现了石油领域石油文献及石油领域术语的知识图谱的构建,其中图3给出了各种石油文献资源与具体的石油术语间的关联关系,在这里除了用到了元本体规范词汇表,如RDF:type等,还用到顶层本体SKOS中的Concept等词汇;以及顶层标准词汇中的DC元数据标准。对于其中的资源或者是实体用到了领域专题标准词汇表,如图情领域BIBO里的BOOK、ISSUE、JOURNAL、CONFERENCE等,这些都是标准词汇集。图4构建出了石油钻井领域的专业知识图谱,用到了元本体规范中的SKOS中的一系列标准词汇来描述这些钻井术语间的关系,如borader、narrower和related等,这里给出的石油钻井领域的知识图谱构建采用了五层模型中的轻型本体词汇表中的《石油汉语主题词表》,即石油叙词表以及领域元数据词汇表中的元数据。构建的原则是将五层模型中的标准词汇表进行有机的融合,从而实现领域知识图谱标准化。最后,设计并开发了石油术语知识图谱服务平台,按照本文给出的构建标准,实现了石油术语数据的发布,在平台即可查看领域内的所有术语,也可根据需求进行领域范围内术语的查询,如图5(a)所示,点击“油气田的开采与开发”,可查看该领域内所包含的术语。点击该领域下井
文章来源:《船舶标准化与质量》 网址: http://www.cbbzhyzl.cn/qikandaodu/2020/0630/336.html