[发明专利]一种基于知识体系图谱构建的人工智能分类方法与系统有效
申请号: | 201910590840.0 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110688549B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 徐超 | 申请(专利权)人: | 光控特斯联(上海)信息科技有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/903 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 李小朋;谷波 |
地址: | 200232 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 体系 图谱 构建 人工智能 分类 方法 系统 | ||
1.一种基于知识体系图谱构建的人工智能分类方法,其特征在于,包括以下步骤:
步骤S1,面向半结构化、非结构化或者不标准结构化的原始数据,转化为多维矢量取值形式的规整数据;
步骤S2,对规整数据映射到预定的多个维度进行聚类;
步骤S3,针对每个聚类类别提取实体、关系、属性组成的知识要素三元数组;并且对知识要素三元数组进行知识融合处理,消除实体、关系、属性之间的歧义;
步骤S4,基于所述知识要素三元数组,组织生成多类型关系图形式的知识体系图谱数据结构;
步骤S5,针对知识体系图谱数据结构,基于所述知识要素的关系及属性进行实体的对象分类;
步骤S1中,按照后续拟抽取的实体类型来设置对应的维度,并且将原始数据反映的每个实体类型对应的特征表达为维度取值;
步骤S3具体包括:
S31知识要素抽取,针对每个聚类包含的规整数据,抽取构成知识体系图谱的实体、关系以及属性的知识要素;
S32三元数组表示,针对步骤S31确定的实体、关系及其属性,将其表达为符合知识体系图谱的三元数组;
S33知识融合,通过步骤S31、S32建立的符合知识体系图谱的三元数组,通过知识融合进行异构数据整合与消歧;
步骤S31进一步包括:代表性实体抽取,实体关系映射,以及确定实体和关系的属性;其中,代表性实体抽取针对每个聚类的规整数据,按照实体类型,对每个类型的实体在其相关维度上的维度取值分布进行直方图统计,并基于直方图统计获得代表性实体;实体关系映射采用通过评价代表性实体的重合度,确定代表性实体之间的关系;基于代表性实体的维度取值的直方图统计,及其代表性实体之间关系的重合度,定义所述实体和关系的属性;
步骤S32进一步包括:针对步骤S31确定的实体、关系及其属性,将其表达为符合知识体系图谱的实体A-关系-实体B,实体-属性-属性值,关系-属性-属性值的三元数组;
步骤S33进一步包括:所述知识融合具体表现为实体对齐,用于消除异构数据中实体冲突、指向不明等不一致性问题;所述实体对齐的主要流程包括:将待对齐的实体本身的属性以及与所述待对齐的实体有关联的实体的属性分别设置不同的权重,并通过加权求和计算总体的相似度,如果相似度大于阈值则将待对齐的实体归并为同一个实体,并相应归并与实体相关的三元数组。
2.根据权利要求1所述的基于知识体系图谱构建的人工智能分类方法,其特征在于,步骤S2中,针对多维矢量取值形式的规整数据,将每个多维矢量看作样本点,假设共有m个规整数据,即m为样本点的总量,给定q个聚类中心点,分别计算每个样本点到q个中心点之间的距离,其中q小于或等于m;q与预计聚类后形成的聚类类别数量一致;将每个样本点标记为与其距离最近的中心点相对应的类别;更新每个类别中的中心点,更新后的中心点与本类别中每个样本点的多维矢量距离最小;重复上述标记样本点对应类别和更新中心点的过程,直到所有样本点其隶属的中心点不再变化,则对规整数据生成多个聚类类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光控特斯联(上海)信息科技有限公司,未经光控特斯联(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910590840.0/1.html,转载请声明来源钻瓜专利网。