[发明专利]用户重复地址的查询方法及装置在审
申请号: | 202111586439.3 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114372094A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 陈庆良;张堉灵;林翰 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2457;G06N3/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 于丹 |
地址: | 100033*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 重复 地址 查询 方法 装置 | ||
本公开提供用户重复地址的查询方法及装置,用于提高重复地址的查询效率。包括:响应于用户发送的重复地址查询请求,基于与所述重复地址查询请求相对应的地址信息,确定与所述地址信息相对应的第一地址向量;利用所述第一地址向量和各地址类别的中心向量,得到所述第一地址向量分别与所述各地址类别的中心向量之间的第一相似度;根据所述第一相似度,确定与所述第一地址向量对应的目标地址类别;通过所述第一地址向量分别与所述目标地址类别对应的各第二地址向量之间的第二相似度,得到至少一个目标地址向量,其中,任一第二地址向量为预先存储的地址信息所对应的向量;将与所述目标地址向量对应的目标地址,确定为与所述地址信息对应的重复地址。
技术领域
本发明涉及信息处理技术领域,特别涉及一种用户重复地址的查询方法及装置。
背景技术
由于同一用户地址在系统中可能会存在不同地址名称,所以需要对这种不同名但实际地址是同一地址的重复地址进行查询,并将各重复地址进行替换更新。
现有技术中,利用用户输入的地址信息的向量与数据库中所有的其他地址信息的向量均计算相似度,以此确定出与输入的地址信息重复的其他地址。但是,此方式导致重复地址的查询效率较低。
发明内容
本公开示例性的实施方式中提供一种用户重复地址的查询方法及装置,用于提高重复地址的查询效率。
本公开的第一方面提供一种用户重复地址的查询方法,所述方法包括:
响应于用户发送的重复地址查询请求,基于与所述重复地址查询请求相对应的地址信息,确定与所述地址信息相对应的第一地址向量;
利用所述第一地址向量和各地址类别的中心向量,得到所述第一地址向量分别与所述各地址类别的中心向量之间的第一相似度;
根据所述第一地址向量分别与所述各地址类别的中心向量之间的第一相似度,确定与所述第一地址向量相对应的目标地址类别;
通过所述第一地址向量分别与所述目标地址类别对应的各第二地址向量之间的第二相似度,得到至少一个目标地址向量,其中,任意一个第二地址向量为预先存储的地址信息所对应的向量;
将与所述目标地址向量相对应的目标地址,确定为与所述地址信息相对应的重复地址。
本实施例中通过所述第一地址向量分别与所述各地址类别的中心向量之间的第一相似度,确定与所述第一地址向量相对应的目标地址类别,并通过所述第一地址向量分别与所述目标地址类别对应的各第二地址向量之间的第二相似度,得到至少一个目标地址向量,然后将与所述目标地址向量相对应的目标地址,确定为与所述地址信息相对应的重复地址。由此,本实施例中第一地址向量只需要确定出与所述目标地址类别对应的各第二地址向量之间的第二相似度,以此来确定出重复地址,提高了重复地址的查询效率。
在一个实施例中,所述通过所述第一地址向量分别与所述目标地址类别对应的各第二地址向量之间的第二相似度,得到至少一个目标地址向量,包括:
对各第二相似度进行排序,得到所述各第二相似度的排列顺序;
从所述各第二相似度的排列顺序中确定出满足指定条件的各第二目标相似度;
针对任意一个第二目标相似度,将所述第二目标相似度所对应第二地址向量与所述第一地址向量输入至预先训练好的神经网络中,得到所述第二地址向量与所述第一地址向量之间的第三相似度;
若所述第三相似度大于指定阈值,则将所述第二地址向量确定为所述目标地址向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111586439.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:川崎病的生物标志物及其应用
- 下一篇:一种汽车维修保养用检测设备平台