[发明专利]搜索结果准确性判断方法、装置、电子设备及存储介质有效
申请号: | 201911207046.X | 申请日: | 2020-01-17 |
公开(公告)号: | CN111061774B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 叶紫阳;魏新明 | 申请(专利权)人: | 深圳云天励飞技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F17/16 |
代理公司: | 深圳驿航知识产权代理事务所(普通合伙) 44605 | 代理人: | 杨伦 |
地址: | 518000 广东省深圳市龙岗区园山街道龙岗大道8288号深圳大运软件小*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 结果 准确性 判断 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种搜索结果准确性判断方法、装置、电子设备及存储介质,所述方法包括:获取待搜索对象的top-k个搜索结果,其中,所述top-k个搜索结果为与所述待搜索对象相似度最高的k个搜索结果,所述k大于1;基于所述待搜索对象以及所述top-k个搜索结果,构建输入矩阵;将所述输入矩阵输入到预先训练好的验证模型中对m个搜索结果进行预测,并输出对应的m个预测结果,其中,所述m小于等于k,且所述m大于等于1;基于所述预测结果对所述待搜索对象的m个搜索结果进行准确性判断。可以不用人工对搜索结果进行判断,进而提高了搜索结果准确性的判断效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种搜索结果准确性判断方法、装置、电子设备及存储介质。
背景技术
在数据搜索包括标签(关键词)搜索以及相似度搜索,在标签搜索过程中,用户给定标签,通过给定的标签匹配到与给定标签相关的数据进行输出;相似度搜索包括文本搜索以及图像搜索,在相似度搜索中,比如人脸识别,通过给定的图像,提取图像中的人脸特征,在人脸数据库中匹配到与人脸特征相似度较高的人脸数据,从匹配到的人脸数据中获取该人脸对应的身份信息,并输出对应的身份信息出来。但是由于文本或图像的原因,比如,文本会有缺失、手写字体不规范的情况,图像会有模糊、遮挡、图像质量不高的情况,导致识别的准确度不高,且搜索出来的结果全部由人来判断是否正确,费时费力。因此,现有基于相似度搜索得到搜索结果准确性的判断存在效率不高的问题。
发明内容
本发明实施例提供一种搜索结果准确性判断方法,能够提高相似度搜索中搜索结果准确性的判断效率。
第一方面,本发明实施例提供一种搜索结果准确性判断方法,包括:
获取待搜索对象的top-k个搜索结果,其中,所述top-k个搜索结果为与所述待搜索对象相似度最高的k个搜索结果,所述k大于1;
基于所述待搜索对象以及所述top-k个搜索结果,构建输入矩阵;
将所述输入矩阵输入到预先训练好的验证模型中对m个搜索结果进行预测,并输出对应的m个预测结果,其中,所述m小于等于k,且所述m大于等于1;
基于所述预测结果对所述待搜索对象的m个搜索结果进行准确性判断。
可选的,所述基于所述待搜索对象以及所述top-k个搜索结果,构建输入矩阵,包括:
将所述待搜索对象以及所述k个搜索结果编码到向量空间,得到k+1维度的向量;
将所述k+1维度的向量进行转置,得到转置向量,并将所述转置向量与所述k+1维度的向量相乘,得到k+1阶的输入矩阵。
可选的,所述验证模型的训练步骤,包括:
获取n个训练对象的搜索结果;
基于所述训练对象的搜索结果,提取每个训练对象的top-k个搜索结果,其中,所述top-k个搜索结果为与所述训练对象相似度最高的k个搜索结果,所述k大于1;
基于所述n个训练对象以及所述每个训练对象的top-k个搜索结果,对应构建n个训练矩阵,并为每个训练矩阵添加对应的m个标签,得到训练集;
将所述训练集输入到验证模型中对所述验证模型进行训练,以使所述验证模型学习到矩阵与标签的预测关系。
可选的,所述为每个训练矩阵添加对应的m个标签,包括:
获取所述n个训练对象对应的训练对象标识;
获取所述每个训练矩阵中m个搜索结果对应的搜索结果标识;
添加每个训练矩阵中训练对象标识与搜索结果标识的标签关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术有限公司,未经深圳云天励飞技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911207046.X/2.html,转载请声明来源钻瓜专利网。