主页 > www.115kj.com >
干货 初学者入门必看的“知识图谱”解读(上)
发布日期:2019-11-06 03:24   来源:未知   阅读:

  的博客文章,其知乎专栏为:AI的怎怎,歪歪不喜欢。欢迎扫描底部社区名片访问

  本系列参考了市面上已知的,几乎全部“知识图谱”相关文章,并总结提炼出一套适合初学者入门的“知识图谱”的知识体系,希望大家能有所收获。

  大家都说,自己在做知识图谱,但从不同人分享的PPT来看,讲述的重点都不一样,那知识图谱到底是什么?

  Quillian在1968年提出的知识表达模式,其用相互连接的节点和边来表示知识。完全由用户自定义,无任何标准和规范,难以用于实践。

  Tim.Lee在1998年提出的一个新概念,描述互联网中资源和数据之间的关系,使得互联网上的数据变得机器可读。常被用来指代一整套技术栈框架。

  即,语义网是比语义网络更高级的概念,它提供了一整套规范和技术栈来解决实际问题。

  (1)编码方式(UNICODE),资源标识符(URI):数据的编码方式和表示方式

  (4)RDFs/OWL:工业标准,使用预定义的词汇,对RDF进行类和属性定义,即,Schema

  (5)RIF/SWRL:推理规则(Rule),使用预定义的规范,使基于RDFs和OWL描述的RDF数据,具有推理能力

  一个用URI和字面量表示的三元组数据模型,即,任何知识都可以通过(subject, predicate, object)来拆解。

  其中,subject和predicate只能是URI,而obeject可以是URI或字面量。当object是URI时,表示(实体,对象属性,实体),简称关系;当object是字面量时,表示(实体,数据属性,值),简称属性。

  RDF本质上只定义了知识的表示规范,但不同实现对应不同的序列化方法。类似,UNICODE是规范,UTF8,UTF16或UTF32是实现方式。

  即,XML-Syntax可以理解为RDF的落地物理数据,类似存储在MySQL中某一行的数据

  比如,定义,Person表示人物概念,hasChild表示父母的对象属性,fullName表示全名的数据属性。

  即,(RDFs/OWL)可以理解为RDF的业务字段定义,类似MySQL中对每个字段的定义:字段名,类型等,使RDF具有了真正的语义含义。

  依附于OWL,它们是集成在OWL上,对概念和属性的约束和限定。它使OWL从此具备了语义推理能力,比如:

  查询RDF数据模型的语言,基于(实体,对象属性,实体)和(实体,数据属性,值)的限定,匹配查询数据结果。

  使用语义网的推理能力,可以丰富和扩展不完备的缺失数据,甚至识别并判定错误关系或错误属性。

  RDFs/OWL是本体描述语言,所以,它们本身对概念和属性的约束和限定就构成了W3C规范里,自带的推理能力。比如:

  用户自定义规则,使用第3方工具(Jena),基于已定义好的RDFs/OWL文件,根据业务需求,指定新的概念和属性,比如:

  基于语义网,使用机器/深度学习方法,自动发现普通人难以发掘的新的概念或属性,作为其他推理能力的扩充。比如:图嵌入