[发明专利]实体关系查询方法和装置有效
申请号: | 201811582250.5 | 申请日: | 2018-12-24 |
公开(公告)号: | CN111427967B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 蒋笑通;汤芬斯蒂;路高飞;曾文烨;叶嘉韬;金晶 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458;G06F40/295;G06Q10/083 |
代理公司: | 北京志霖恒远知识产权代理有限公司 11435 | 代理人: | 郭栋梁 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 查询 方法 装置 | ||
本申请公开了一种实体关系查询方法和装置,所述方法包括以下步骤:根据实体的亲密度关系构建实体表述矩阵,所述实体表述矩阵由V个实体的N维向量组成;在实体表述矩阵中确定设定个数的与查询实体关系最亲密的实体并显示。本申请的技术方案中算法的空间复杂度和训练时间大大缩小,不需要构建集群,在普通pc就可完成训练;通过多维度挖掘实体之间的相互关系,为物流行业的精细化管理,智能决策提供保障和依据。
技术领域
本公开一般涉及物流大数据领域,具体涉及物流中的实体关系技术领域,尤其涉及一种实体关系查询方法和装置。
背景技术
近年来,伴随着电子商务以及物流行业的发展,快件量迅速增长,各式各样的需求和投诉也随之增加,对物流公司的服务要求也越来越高。各级负责人非常想知道自己的管辖区域的运营状态,以便采取对应的措施。比如,网点A的托寄物经常发往哪些城市,是否经常发出大闸蟹。如果我们把网点A、各个城市、大闸蟹当作实体,以上两个问题可以归为网点A实体与各个城市、网点A实体与大闸蟹实体同现关系的亲密度问题。
如果网点A出了某些问题,网点负责人想知道自己管理的网点C是否与网点A为同一类的网点,以便采取预防措施。这类问题可以归为网点A实体与网点实体C的同类关系亲密度问题。
对于这种问题,企业采用最多的是对历史运单数据查询统计构建共现矩阵的方式挖掘同现关系、矩阵分解降维进而进行聚类的方式来挖掘同类关系,而这些方式在物流行业存在着诸多问题。
构建共现矩阵挖掘共现关系,占用大量资源空间。物流行业实体众多,仅仅托寄物就有几十万上百万之多,加上其它实体如网点、城市、区县等,实体数量将会非常庞大。假设物流公司细分的实体数量为50万,构建这样共现矩阵占用50万*50万=2500亿个存储单元,占用巨大的资源空间,同时大大提高了算法的空间复杂度。
共现矩阵维度太高,且存在大量稀疏值,现有方法主要通过矩阵分解降维,如SVD分解等算法,来挖掘同类关系,然而由于共现矩阵非常庞大,计算将会非常耗费时间和占用资源。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种资源耗费少、运算效率高的实体关系查询方法和装置。
第一方面,本申请提供一种实体关系查询方法,所述方法包括以下步骤:
根据实体的亲密度关系构建实体表述矩阵,所述实体表述矩阵由V个实体的N维向量组成;
在实体表述矩阵中确定设定个数的与查询实体关系最亲密的实体并显示。
根据本申请实施例提供的技术方案,所述根据实体的亲密度关系构建实体表述矩阵具体包括以下步骤:
获取运单数据,所述运单数据包括字段和与每个字段对应的实体;
将每条运单数据语料化后存入语料库;构建神经网络语言模型并基于所述语料库训练该模型后得到所述实体表述矩阵。
根据本申请实施例提供的技术方案,所述构建神经网络语言模型并基于所述语料库训练该模型后得到所述实体表述矩阵包括以下步骤:
构建神经网络语言模型,即构建1个V*N的W矩阵,和通过隐藏层导出的C个N*V的W1'、W2'......Wc'矩阵;V为实体的总数量,N为实体的表述维度,C为设定的实体在其所在的运单数据中的上下文字段的窗口大小;
构建损失函数f损;
基于损失函数f损确定目标函数f目;
基于目标函数对神经网络语言模型进行迭代优化得到所述实体表述矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811582250.5/2.html,转载请声明来源钻瓜专利网。