[发明专利]一种基于知识体系图谱构建的人工智能分类方法与系统有效
申请号: | 201910590840.0 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110688549B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 徐超 | 申请(专利权)人: | 光控特斯联(上海)信息科技有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/903 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 李小朋;谷波 |
地址: | 200232 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 体系 图谱 构建 人工智能 分类 方法 系统 | ||
本申请提供了一种基于知识体系图谱构建的人工智能分类方法和系统。针对大规模的数据资源,通过有效开展组织关联,形成知识体系图谱化的数据结构。具体来说,通过对原始数据进行知识提取,从半结构化、非结构化和不标准结构化的原始数据中提取出实体、关系、属性等知识要素,进而对这些知识要素用有效的数据结构进行知识表示,便于进一步处理使用。进一步来说,本发明可以通过知识融合,消除实体、关系、属性之间的歧义,形成高质量的知识体系图谱型数据结构。进而,本发明基于知识体系图谱化数据,开展针对特征属性的规律性挖掘和对象分类。
技术领域
本申请涉及用于智能大数据技术领域,尤其涉及一种基于知识体系图谱构建的人工智能分类方法与系统。
背景技术
大数据技术是推动人类社会进入智能化时代的重要力量。目前,数据采集手段日益丰富,从线上走向线下,不论是提供各种互联网服务、移动支付、媒体资讯的平台,还是具备人员身份识别、空间定位能力的智能设备,都在发挥自身功能的同时,不断的收集数据,从而聚合形成了海量的大数据资源。
众所周知,大数据资源要发挥其作用,则必须从原始数据当中发掘其特征属性所具有的分布规律性,进而可以根据这些分布规律性实现对象分类。
例如,对于某种智能设备产品来说,单纯收集100000个用户的用户使用信息是没有价值的,只有从这些用户使用信息形成的原始数据中,发掘出这些用户在性别、年龄、使用行为、使用历史等特征属性上表现的规律性,才能够为该智能设备在更新换代、功能优化等方面提供定量依据。例如,可以根据用户在性别、年龄、使用行为、使用历史等特征属性的共性和特性实现用户分类,属于同一类别的用户特征属性具有共性,不同类别的用户特征属性彼此具有差异性;然后,可以针对其中某一类别用户,实现产品个性化的功能升级。
然而,随着大数据资源总量的持续加速扩张,如何能够从大数据当中更为准确和快速发掘其特征属性蕴含的规律性,作为对象分类的基本依据,成为了当前大数据技术研究的热点和难点,并由此衍生出了很多的技术创新。例如,为了实现更为高效率的大数据处理和分析,提出了Hadoop、Samza、Storm、Spark等各种软硬件架构;为了更为精确的提取数据的规律性,提出了聚类、归回分析等数据挖掘算法。
其中,经过长期的研究和实践发现,除了上述架构和算法层面的改进以外,如何对大数据进行有效的组织和关联,形成优质科学的数据结构,是提高规律性挖掘效率和分类准确度的一个关键手段。然而,目前在大数据数据结构本身的研究中,还主要停留在数据清洗、数据格式规范化以及异常数据排除等层面,对如何形成有利于规律性挖掘和对象分类的数据基本结构,在现有技术中尚属于短板。
发明内容
有鉴于此,本申请的目的在于提出一种基于知识体系图谱构建的人工智能分类方法与系统。
本发明针对大规模的数据资源,通过有效开展组织关联,形成知识体系图谱化的数据结构。具体来说,通过对原始数据进行知识提取,从半结构化、非结构化和不标准结构化的原始数据中提取出实体、关系、属性等知识要素,进而对这些知识要素用有效的数据结构进行知识表示,便于进一步处理使用。进一步来说,本发明可以通过知识融合,消除实体、关系、属性之间的歧义,形成高质量的知识体系图谱型数据结构。进而,本发明基于知识体系图谱化数据,开展针对特征属性的规律性挖掘和对象分类。
基于上述目的,在本申请的第一个方面,提出了一种基于知识体系图谱构建的人工智能分类方法,其特征在于,包括以下步骤:
步骤S1,面向半结构化、非结构化或者不标准结构化的原始数据,转化为多维矢量取值形式的规整数据;
步骤S2,对规整数据映射到预定的多个维度进行聚类;
步骤S3,针对每个聚类类别提取实体、关系、属性组成的知识要素三元数组;并且对知识要素三元数组进行知识融合处理,消除实体、关系、属性之间的歧义;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光控特斯联(上海)信息科技有限公司,未经光控特斯联(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910590840.0/2.html,转载请声明来源钻瓜专利网。