商业要素知识建模

商业要素涉及多种不同类型的知识,我们针对不同的知识类型采用不同的知识建模方法。例如针对标品知识所涉及的类目及属性关系型知识,我们采用本体表示语言进行建模;对于概念型知识我们采用更为简单概念层次关系表示方法;对于实体关系型知识我们采用属性图Property Graph方式进行建模;对于商业规则知识我们采用规则知识建模方法。通过建立一套基于消费者需求场景的知识图谱表示体系来组织商品,并把商业要素知识沉淀到图谱中,以解决业务痛点。AliOpenKG已经包含近200万元组的本体三元组,一百多万条概念知识,近十多亿的实体关系三元组,以及二十多万条的规则型知识(待发布)。

0
本体三元组数
0
概念知识条数
0
实体关系数
0
规则知识条数

知识建模概览

基于多源异构的数据,从多角度、多层次、多粒度对消费者购物场景进行知识建模。从知识类型来看,包含表示购物场景核心概念和关系的连接和语义约束的核心本体类目知识建模、表示购物场景核心概念之间层次的概念体系知识建模、表示购物场景中实例之间的关系的实体关系知识建模、表示适用于可迁移的购物场景推理的规则型知识建模、非结构化描述购物场景的文本型知识建模。

核心本体建模方法

主要包含核心类(class)和属性知识,这里的类是语义知识相对丰富的对象,属性知识主要包括类的上下位、等价以及不同类之间的关系。核心类的上下位知识用rdfs:subClassOf来表征,比如:(大米, rdfs:subClassOf, 米类),等价关系用owl:equivalentClass来表征。本次发布的开放的数据商业知识图谱包含3种核心超类,即产品类目、品牌、产地。核心类和属性共计463,486种。

概念体系建模方法

主要涉及核心概念(concept)的上下位层级知识,这里的核心概念是相对简单的对象,会和核心类之间产生关联,这部分的知识用skos来建模。核心概念的上下位层级知识可用skos:broader来表征,比如:(做饭团, skos:broader, 吃粥饭米食)。本次发布的开放的数据商业知识图谱包含5大类核心概念,即场景、主题、时间、人群、细分市场。核心概念共计670,774种。

实体关系建模方法

主要包括核心类和概念的实例之间的关系,以及实例本身的属性信息。实例通过rdf:type来表征和核心类/概念的实例化关系,比如(优质东本大米, rdf:type, 大米);通过一系列对象属性来表征实例之间的关系,比如 (优质东本大米, relatedScene, 做饭团);通过一系列数据属性来刻画实例的属性信息,比如 (优质东本大米, 储存条件, 常温)。

规则型知识表示方法

主要包括图谱中的一些数据规范,可用于不一致性检测等一系列本体推理任务,定义为知识图谱本体中的一些axioms,这部分的知识可以用一系列规则推理模型来建模。比如,(产品A, 含糖量, 0%) ==> (产品A, rdf:type, 无糖食品)。目前图谱沉淀了二十几万条的规则型知识,待发布。

文本型知识表示方法

主要涉及核心类/概念的标题以及他们对应的文本描述,这部分的知识可以用语言模型来建模。比如:一个标准产品实例的标题为“优质东北大米”,对应的描述文本为“东北长粒香大米,优质东北大米,吉林梅河口特产香米系列,精选优质大米,产地环境好,温差大,土壤肥沃,米粒均匀,口感醇厚,颗粒饱满,非常香”。在我们的应用中,文本型知识主要通过语言预训练模型进行编码,并与结构化的图谱知识进行融合和统一处理。