[发明专利]一种类案检索方法、系统、电子设备及存储介质在审
申请号: | 202310187729.3 | 申请日: | 2023-03-02 |
公开(公告)号: | CN116069903A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 邹游 | 申请(专利权)人: | 特斯联科技集团有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/211;G06N3/088 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明;赵吉阳 |
地址: | 101199 北京市通州*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种类 检索 方法 系统 电子设备 存储 介质 | ||
1.一种类案检索方法,其特征在于,所述方法包括:
接收用户的检索案例请求;其中,所述检索案例请求包括检索案例句子;
将所述检索案例句子输入预先训练的类案检索编码器,得到对应的句子向量表示;其中,所述类案检索编码器采用基于对比学习的无监督方式预先训练得到;
根据所述句子向量表示和案例向量表示集合,得到与所述检索案例句子相似的相似案例;其中,所述案例向量表示集合经由所述类案检索编码器对案例集合处理得到。
2.根据权利要求1所述的类案检索方法,其特征在于,所述类案检索编码器采用以下步骤训练得到:
设置类案检索编码器encoder和动量编码器momentum encoder;
更新所述encoder和所述momentum encoder的网络权重,根据损失函数
3.根据权利要求2所述的类案检索方法,其特征在于,所述损失函数
(1)
其中,
4.根据权利要求2所述的类案检索方法,其特征在于,所述更新所述encoder和所述momentum encoder的网络权重,包括:
通过反向传播法更新所述encoder的网络权重;
通过如下式(2)更新所述momentum encoder的网络权重:
(2)
其中,为所述momentum encoder的网络权重,为所述encoder的网络权重,;
在更新所述momentum encoder的过程中每个最新的mini-batch数据进入队列,最旧的数据出队列,每一批mini-batch的数据进行训练的时候,队列的数据编码作为负样本进行对比学习。
5.根据权利要求1所述的类案检索方法,其特征在于,所述根据所述句子向量表示和案例向量表示集合,得到与所述检索案例句子相似的相似案例,包括:
分别计算所述句子向量表示与所述案例向量表示集合中的各案例向量表示的相似度,选取相似度最高的多个案例作为所述相似案例。
6.根据权利要求5所述的类案检索方法,其特征在于,所述分别计算所述句子向量表示与所述案例向量表示集合中的各案例向量表示的相似度,选取相似度最高的多个案例作为所述相似案例,包括:
分别将各所述案例向量表示分布在对应的多个节点;
对每个所述节点,通过余弦相似度计算所述句子向量表示与该节点的案例向量表示的相似度,得到多个所述节点的案例选取结果;
合并各所述节点的案例选取结果,并根据相似度对所述案例选取结果进行降序排序,选取前K个案例作为所述相似案例。
7.一种类案检索系统,其特征在于,所述系统包括:
接收模块:用于接收用户的检索案例请求;其中,所述检索案例请求包括检索案例句子;
编码模块:将所述检索案例句子输入预先训练的类案检索编码器,得到对应的句子向量表示;其中,所述类案检索编码器采用基于对比学习的无监督方式预先训练得到;
计算模块:用于根据所述句子向量表示和案例向量表示集合,得到与所述检索案例句子相似的相似案例;其中,所述案例向量表示集合经由所述类案检索编码器对案例集合处理得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯联科技集团有限公司,未经特斯联科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310187729.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:钢丝绳带式输送机清扫装置
- 下一篇:一种飞机燃油系统气密性检测仪