[发明专利]一种类案检索方法、系统、电子设备及存储介质在审

专利信息
申请号: 202310187729.3 申请日: 2023-03-02
公开(公告)号: CN116069903A 公开(公告)日: 2023-05-05
发明(设计)人: 邹游 申请(专利权)人: 特斯联科技集团有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F40/211;G06N3/088
代理公司: 北京中知法苑知识产权代理有限公司 11226 代理人: 李明;赵吉阳
地址: 101199 北京市通州*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 种类 检索 方法 系统 电子设备 存储 介质
【权利要求书】:

1.一种类案检索方法,其特征在于,所述方法包括:

接收用户的检索案例请求;其中,所述检索案例请求包括检索案例句子;

将所述检索案例句子输入预先训练的类案检索编码器,得到对应的句子向量表示;其中,所述类案检索编码器采用基于对比学习的无监督方式预先训练得到;

根据所述句子向量表示和案例向量表示集合,得到与所述检索案例句子相似的相似案例;其中,所述案例向量表示集合经由所述类案检索编码器对案例集合处理得到。

2.根据权利要求1所述的类案检索方法,其特征在于,所述类案检索编码器采用以下步骤训练得到:

设置类案检索编码器encoder和动量编码器momentum encoder;

更新所述encoder和所述momentum encoder的网络权重,根据损失函数Li得到训练好的类案检索编码器。

3.根据权利要求2所述的类案检索方法,其特征在于,所述损失函数Li满足下述关系式:

          (1)

其中,M表示momentum encoder的队列大小,表示momentum encoder的队列中的负样本的编码表示,N表示每个mini-batch的大小,表示每个mini-batch的负样本的编码表示,和分别表示每个样本和它增强的正样本。

4.根据权利要求2所述的类案检索方法,其特征在于,所述更新所述encoder和所述momentum encoder的网络权重,包括:

通过反向传播法更新所述encoder的网络权重;

通过如下式(2)更新所述momentum encoder的网络权重:

                (2)

其中,为所述momentum encoder的网络权重,为所述encoder的网络权重,;

在更新所述momentum encoder的过程中每个最新的mini-batch数据进入队列,最旧的数据出队列,每一批mini-batch的数据进行训练的时候,队列的数据编码作为负样本进行对比学习。

5.根据权利要求1所述的类案检索方法,其特征在于,所述根据所述句子向量表示和案例向量表示集合,得到与所述检索案例句子相似的相似案例,包括:

分别计算所述句子向量表示与所述案例向量表示集合中的各案例向量表示的相似度,选取相似度最高的多个案例作为所述相似案例。

6.根据权利要求5所述的类案检索方法,其特征在于,所述分别计算所述句子向量表示与所述案例向量表示集合中的各案例向量表示的相似度,选取相似度最高的多个案例作为所述相似案例,包括:

分别将各所述案例向量表示分布在对应的多个节点;

对每个所述节点,通过余弦相似度计算所述句子向量表示与该节点的案例向量表示的相似度,得到多个所述节点的案例选取结果;

合并各所述节点的案例选取结果,并根据相似度对所述案例选取结果进行降序排序,选取前K个案例作为所述相似案例。

7.一种类案检索系统,其特征在于,所述系统包括:

接收模块:用于接收用户的检索案例请求;其中,所述检索案例请求包括检索案例句子;

编码模块:将所述检索案例句子输入预先训练的类案检索编码器,得到对应的句子向量表示;其中,所述类案检索编码器采用基于对比学习的无监督方式预先训练得到;

计算模块:用于根据所述句子向量表示和案例向量表示集合,得到与所述检索案例句子相似的相似案例;其中,所述案例向量表示集合经由所述类案检索编码器对案例集合处理得到。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯联科技集团有限公司,未经特斯联科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310187729.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top