[发明专利]一种文件检索的方法及设备在审
申请号: | 202011010296.7 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112148702A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 朱弘煜 | 申请(专利权)人: | 平安直通咨询有限公司上海分公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/36;G06F16/9535;G06Q50/18 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 200040 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 检索 方法 设备 | ||
1.一种文件检索的方法,其特征在于,包括:
接收检索请求;所述检索请求包含目标文本以及检索类型;
基于预设的法律知识图谱,生成关于所述目标文本的文本向量;
选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段;
从文件数据库中选取与所述检索语段匹配的目标法律文件,生成检索结果。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的法律知识图谱,生成关于所述目标文本的文本向量,包括:
获取预设的划分粒度信息;所述划分粒度信息包含N个划分层级;所述N为不小于1的正整数;
基于第n个划分层级,将所述目标文本划分为多个n类信息段,并基于所述法律知识图谱,各个确定所述n类信息段对应的文本标签;所述n的初始值为1;
若所述n小于所述N,则将所述n类信息段识别为目标文本,并增加所述n的值,返回执行所述基于第n个划分层级,将所述目标文本划分为多个n类信息段,并基于所述法律知识图谱,各个确定所述n类信息段对应的文本标签;
若所述n大于或等于所述N,则基于所有文本标签,生成所述文本向量。
3.根据权利要求1所述的方法,其特征在于,在所述基于预设的法律知识图谱,生成关于所述目标文本的文本向量之前,还包括:
获取用于构建所述法律知识图谱的法律知识标签;
基于所述文件数据库内的所有已有法律文件,确定所述法律知识标签之间的关联关系以及所述关联关系对应的关联类型;所述关联类型用于表示所述关联关系的适用场景;
基于同一所述关联类型的所有所述法律知识标签之间的所述关联关系,构建所述关联类型的知识子图谱;
提取各个标准法律文本的核心法律标签,并在各个所述关联类型对应的所述知识子图谱内标记与所述核心法律标签匹配的关联知识标签;
根据属于同一所述核心法律标签的各个所述关联知识标签,建立多个所述关联类型的所述知识子图谱之间的关联关系,生成所述法律知识图谱;属于同一所述核心法律标签的各个所述关联知识标签对应的法律实体相同。
4.根据权利要求3所述的方法,其特征在于,所述基于所述文件数据库内的所有已有法律文件,确定所述法律知识标签之间的关联关系以及所述关联关系对应的关联类型,包括:
对已有法律文件进行语义分析,确定所述已有法律文件对应的文本类型;
若所述已有法律文本的任一语段内包含多个所述法律知识标签,则基于所述已有法律文本的所述语段中的其他字符,确定所述多个法律知识标签之间的关联关系;所述其他字符为在所述已有法律文本的所述语段中除所述多个法律知识标签外的字符;
根据所述文本类型,确定所述关联关系对应的所述关联类型。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段,包括:
若所述检索类型为关联检索,则将所述文本向量导入预设的关键词检索模型,得到所述目标文本对应的检索关键词;
根据预设的模糊搜索算法,生成各个所述检索关键词对应的模糊关键词;
根据所述检索关键词以及模糊关键词,确定所述目标文本的目标检索范围;
生成所述目标检索范围对应的所述检索语段。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段,包括:
若所述检索类型为问答检索,则将所述文本向量导入预设的提问检索模型,得到所述目标文本关联的提问列表;所述提问列表内包含至少一个法律问题;
获取各个法律问题对应的回答语段以及法律领域;
基于所述回答语段以及法律领域生成所述检索语段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安直通咨询有限公司上海分公司,未经平安直通咨询有限公司上海分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011010296.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:梁柱式落地梁及其施工方法
- 下一篇:模型平面布局方法、系统以及计算机设备