[发明专利]一种基于深度学习的知识图谱获取方法有效
| 申请号: | 202011415892.3 | 申请日: | 2020-12-07 |
| 公开(公告)号: | CN112199961B | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 汪晖;陆建波;王恩茂;钱微夏 | 申请(专利权)人: | 浙江万维空间信息技术有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/28;G06F16/36;G06F16/81 |
| 代理公司: | 杭州快知知识产权代理事务所(特殊普通合伙) 33293 | 代理人: | 杨冬玲 |
| 地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 知识 图谱 获取 方法 | ||
1.一种基于深度学习的知识图谱获取方法,其特征在于,包括:
获取异构数据,所述异构数据包括结构化数据、半结构化数据和非结构化数据;
根据自然语言处理技术将所述异构数据进行相应的处理,得到词向量;
获取目标行业信息,所述目标行业信息包括M个节点和消息特征,其中,M为大于2的整数;
将所述消息特征从第一个节点传输至相邻节点,在所述相邻节点将所述消息特征进行处理,所述处理步骤包括聚合操作和神经网络的非线性变换,并将处理后的消息特征传输至下一节点,以此迭代学习最终学会函数参数表示,得到图谱神经网络模型;
将所述词向量输入至所述图谱神经网络模型,得到第一知识图谱;
根据聚类法和词袋模型对所述第一知识图谱进行处理,得到第二知识图谱。
2.根据权利要求1所述的一种基于深度学习的知识图谱获取方法,其特征在于,根据自然语言处理技术将所述异构数据进行相应的处理,得到词向量,包括:
根据所述结构化数据和所述半结构化数据构建知识库;
根据实体链接技术识别所述非结构化数据中的候选实体,并将所述候选实体消歧,得到所述知识库中的实体,所述知识库还包括实体关系和实体属性;
基于所述实体关系将所述实体与所述知识库建立连接,并将所述实体在所述知识库中向量化表示,得到词向量。
3.根据权利要求1所述的一种基于深度学习的知识图谱获取方法,其特征在于,根据聚类法和词袋模型对所述第一知识图谱进行处理,得到第二知识图谱,包括:
获取所述第一知识图谱,并根据TF-IDF模型获取文本特征词集合,所述第一知识图谱用于表示词义序列关系,所述文本特征词集合包括多义词;
根据所述词义序列关系确定所述多义词在指定语义环境中的唯一语义;
根据所述唯一语义将所述多义词在所述文本特征词集合中进行聚类,得到第二知识图谱。
4.一种基于深度学习的知识图谱获取装置,其特征在于,包括:
获取模块:用于获取异构数据,所述异构数据包括结构化数据、半结构化数据和非结构化数据;
处理模块:用于根据自然语言处理技术将所述获取模块获取的所述异构数据进行相应的处理,得到词向量;
训练模块:用于获取目标行业信息,所述目标行业信息包括M个节点和消息特征,其中,M为大于2的整数;将所述消息特征从第一个节点传输至相邻节点,在所述相邻节点将所述消息特征进行处理,所述处理步骤包括聚合操作和神经网络的非线性变换,并将处理后的消息特征传输至下一节点,以此迭代学习最终学会函数参数表示,得到图谱神经网络模型;将所述处理模块得到的所述词向量输入至图谱神经网络模型,得到第一知识图谱;
聚类模块:用于根据聚类法和词袋模型对所述训练模块得到的所述第一知识图谱进行处理,得到第二知识图谱。
5.根据权利要求4所述的一种基于深度学习的知识图谱获取装置,其特征在于,所述处理模块具体包括:
构建单元:用于根据所述结构化数据和所述半结构化数据构建知识库;
识别单元:用于根据实体链接技术识别所述非结构化数据中的候选实体,并将所述候选实体消歧,得到所述知识库中的实体,所述知识库还包括实体关系和实体属性;
连接单元:用于基于所述实体关系将所述实体与所述构建单元构建的所述知识库建立连接,并将所述实体在所述知识库中向量化表示,得到词向量。
6.根据权利要求4所述的一种基于深度学习的知识图谱获取装置,其特征在于,所述聚类模块具体还包括:
第二获取单元:用于获取所述第一知识图谱,并根据TF-IDF模型获取文本特征词集合,所述第一知识图谱用于表示词义序列关系,所述文本特征词集合包括多义词;
确定单元:用于根据所述第二获取单元获取的所述词义序列关系确定所述多义词在指定语义环境中的唯一语义;
向量化单元:用于根据所述确定单元得到的所述唯一语义将所述多义词在所述文本特征词集合中进行聚类,得到第二知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江万维空间信息技术有限公司,未经浙江万维空间信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011415892.3/1.html,转载请声明来源钻瓜专利网。





