[发明专利]一种数据处理的方法及电子设备有效
| 申请号: | 201910019965.8 | 申请日: | 2019-01-09 |
| 公开(公告)号: | CN109828965B | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 黄华 | 申请(专利权)人: | 千城数智(北京)网络科技有限公司 |
| 主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/36;G06F16/28 |
| 代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
| 地址: | 100024 北京市朝阳区三间房*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 电子设备 | ||
公开了一种数据处理的方法及电子设备,用于解决现有技术中由于建模过程中建模数据的深度和广度较差,导致生产的模型的稳定性差的问题。包括:根据知识图谱确定建模数据;根据所述建模数据生成建模集合;根据所述建模集合训练模型;输出所述模型。
技术领域
本发明涉及数据处理领域,尤其涉及一种数据处理的方法及电子设备。
背景技术
随着互联网技术的发展、数据的不断增加,使用现有技术进行建模时,建模前需要将关系型数据库中的实体进行向量化,然后构建集合生成模型,具体的,需要通过人工提取或者通过特征学习的方式将实体的描述维度向量化,但由于关系型 数据库的数据只能确定出实体的平面维度,因此无法有效将实体关系通过实体向量化利用起来,造成数据利用的深度不够的问题,并且随着数据的增加,关系型数据库在描述大量实体关系时不堪重负,导致关系型数据库的处理密集查询的性能也会随之变差,构建集合的效率低,而且关系型数据库的扩展性差,影响建模时数据来源的广度,由于建模过程中建模数据的深度和广度较差,导致生产的模型的稳定性差。
综上所述,如何提高建模过程中建模数据的深度和广度,提高模型的稳定性,是目前需要解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种数据处理的方法及电子设备,提高了建模过程中建模数据的深度和广度,提高了模型的稳定性。
根据本发明实施例的第一方面,提供了一种数据处理的方法,包括:根据知识图谱确定建模数据;根据所述建模数据生成建模集合;根据所述建模集合训练模型;输出所述模型。
在一个实施例中,根据知识图谱确定建模数据,具体包括:在所述知识图谱的图数据库中确定实体和实体属性;在所述知识图谱的关系数据库和非关系数据库中确定所述实体和实体属性对应的第一数据;通过所述实体、所述实体属性以及所述第一数据确定实体向量化数据,并通过设定算法确定所述实体的关系数据;将所述关系数据映射到所述实体向量化数据中,确定所述建模数据。
在一个实施例中,所述设定算法为概率图模型算法。
在一个实施例中,所述建模集合包括训练集、测试集和验证集。
在一个实施例中,根据所述建模集合训练模型,具体包括:根据所述建模集合,通过机器学习训练所述模型。
在一个实施例中,所述输出所述模型,具体包括:通过配置文件输出所述模型。
根据本发明实施例的第二方面,提供了一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面或第一方面任一实施例中所述的方法。
根据本发明实施例的第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面或第一方面任一实施例中所述的方法。
本发明实施例中,首先根据知识图谱确定建模数据,然后根据所述建模数据生成建模集合训练模型,最后输出所述模型。由于根据知识图谱处理密集查询的性能较高,因此生成建模集合的效率较高,并且根据知识图谱确定的建模数据深度和广度较高,提高了模型的稳定性。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本发明实施例提供的一种数据处理的方法流程图;
图2是本发明实施例提供的一种图数据库、关系数据库和非关系数据库关系示意图;
图3是本发明实施例提供的图数据库结构示意图;
图4是本发明实施例提供的图数据库的内部关系示意图;
图5是本发明实施例提供的一种电子设备示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于千城数智(北京)网络科技有限公司,未经千城数智(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910019965.8/2.html,转载请声明来源钻瓜专利网。





