[发明专利]一种基于深度学习的知识图谱获取方法有效
| 申请号: | 202011415892.3 | 申请日: | 2020-12-07 |
| 公开(公告)号: | CN112199961B | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 汪晖;陆建波;王恩茂;钱微夏 | 申请(专利权)人: | 浙江万维空间信息技术有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/28;G06F16/36;G06F16/81 |
| 代理公司: | 杭州快知知识产权代理事务所(特殊普通合伙) 33293 | 代理人: | 杨冬玲 |
| 地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 知识 图谱 获取 方法 | ||
本发明公开了一种基于深度学习的知识图谱获取方法,包括获取异构数据,将所述异构数据划分为结构化数据、半结构化数据和非结构化数据;根据自然语言处理技术将所述异构数据进行相应的处理,得到词向量;将所述词向量输入至图谱神经网络模型,得到第一知识图谱;根据聚类法和词袋模型对所述第一知识图谱进行处理,得到第二知识图谱,相对于传统的自监督模式,本发明较为灵活,不同的数据源可以使用不同的方法,也可以根据不同的需求偏向和场景特征进行选择,最大化的突出每种方法的优势,更优的降低成本和提高成果精确度。
技术领域
本发明涉及深度学习领域,尤其涉及一种基于深度学习的知识图谱获取方法。
背景技术
知识图谱,本质上是一种揭露实体之间关系的语义网络,在逻辑结构上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储,如果用(实体1,关系,实体2)、(实体,属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,例如开源的 Neo4j、Twitter 的 FlockDB、JanusGraph 等,模式层构建在数据层之上,主要是通过本体库来规范数据层的一系列事实表达,本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。
大规模知识库的构建与应用需要多种智能信息处理技术的支持,通过知识抽取技术,可以从一些公开的半结构化、非结构化的数据中提取出实体、关系、属性等知识要素,通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库,知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库,分布式的知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。
现有技术中存在这样一种知识图谱的构建方法:利用某行业工艺领域的开放数据源,建立原始资料数据库,将原始资料数据库划分为结构化、半结构化和非结构化资料,根据结构化和半结构化构建知识图谱数据层,并建立知识图谱模式层和数据层之间的映射关系,采用自监督学习法提取原始资料数据库中非结构化资料中包含的实体、关系及实体属性信息,并依据建立的知识图谱数据层和模式层之间的映射关系,补充知识图谱数据层,对知识图谱数据层进行知识融合,对融合后的数据进行知识推理,得到领域知识图谱,这样得到的知识库,需要融合人的思想和信息,其中,知识更新是一个重要的部分,人类的认知能力、知识储备以及业务需求都会随时间而不断递增,因此,知识图谱的内容也需要与时俱进,不论是通用知识图谱,还是行业知识图谱,它们都需要不断地迭代更新,扩展现有的知识,增加新的知识,但是由于人的思想融入而得到的知识库,虽然具有灵活性,但是不及人工智能深度学习所获得的知识图谱更全面,动态更新更快,所展示出的知识网更复杂,因此基于此所得到的知识图谱所获得的知识更加准确。
发明内容
本发明提供的一种基于深度学习的知识图谱获取方法,旨在解决现有技术中创建知识图谱需要加入人工的知识和经验而导致获取的知识图谱关系网不全面、不灵活的问题。
为实现上述目的,本发明采用以下技术方案:
本发明的一种基于深度学习的知识图谱获取方法,包括以下步骤:
获取异构数据,将所述异构数据划分为N个结构数据,其中,N为大于1 的整数;
根据自然语言处理技术将所述N个结构数据进行相应的处理,得到词向量;
将所述词向量输入至图谱神经网络模型,得到第一知识图谱;
根据聚类法和词袋模型对所述第一知识图谱进行处理,得到第二知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江万维空间信息技术有限公司,未经浙江万维空间信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011415892.3/2.html,转载请声明来源钻瓜专利网。





