[发明专利]实体关系查询方法和装置有效
申请号: | 201811582250.5 | 申请日: | 2018-12-24 |
公开(公告)号: | CN111427967B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 蒋笑通;汤芬斯蒂;路高飞;曾文烨;叶嘉韬;金晶 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458;G06F40/295;G06Q10/083 |
代理公司: | 北京志霖恒远知识产权代理有限公司 11435 | 代理人: | 郭栋梁 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 查询 方法 装置 | ||
1.一种实体关系查询方法,其特征在于,所述方法包括以下步骤:
获取运单数据,所述运单数据包括字段和与每个字段对应的实体;将每条运单数据语料化后存入语料库;
构建神经网络语言模型并基于所述语料库训练该模型后得到所述实体表述矩阵,所述实体表述矩阵由
在实体表述矩阵中确定设定个数的与查询实体关系最亲密的实体并显示;
其中,所述构建神经网络语言模型并基于所述语料库训练该模型后得到所述实体表述矩阵包括以下步骤:
构建神经网络语言模型,即构建1个
构建损失函数f损,
f损=
基于损失函数f损确定目标函数f目,
f目=
;
基于目标函数对神经网络语言模型进行迭代优化得到所述实体表述矩阵。
2.根据权利要求1所述的一种实体关系查询方法,其特征在于,所述构建神经网络语言模型并基于所述语料库训练该模型后得到所述实体表述矩阵具体包括以下步骤:
采用随机梯度下降法对神经网络语言模型进行迭代优化,得到最终的矩阵W和W1'至Wc';
将矩阵W和W1'至Wc'的转置矩阵相加求平均,得到实体表述矩阵。
3.根据权利要求1所述的一种实体关系查询方法,其特征在于,所述将每条运单数据语料化后存入语料库之前还包括以下步骤:
将每条运单数据中的实体通过以下步骤规范化:
从运单数据中获取初步实体;
将获取到的初步实体分别与和其对应的字典匹配,并用匹配到的实体替换掉该初步实体。
4.根据权利要求3所述的一种实体关系查询方法,其特征在于,所述将获取到的初步实体分别与和其对应的字典匹配,并用匹配到的实体替换掉该初步实体具体包括以下步骤:
将初步实体中每个汉字的形码和音码分别与和其对应的字典中的汉字的形码和音码匹配;
将用形码匹配的值和将用音码匹配的值加权求和得到与该初步实体中的汉字匹配的匹配值,将与该匹配值对应的汉字替换掉所述初步实体中的汉字,得到与所述初步实体匹配的实体。
5.根据权利要求4所述的一种实体关系查询方法,其特征在于,
每个所述汉字的形码通过以下方式获得:
对汉字进行形音编码;
用卷积神经网络对每个汉字的形音编码进行高级形状特征提取,得到一个8维向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811582250.5/1.html,转载请声明来源钻瓜专利网。