[发明专利]一种面向司法文本的搜索排序方法及系统有效

申请号：	201910554551.5	申请日：	2019-06-25
公开（公告）号：	CN110347812B	公开（公告）日：	2021-09-10
发明（设计）人：	王开红;陈涛;张云云;丁锴;李建元	申请（专利权）人：	银江股份有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/338;G06F40/284;G06N3/04
代理公司：	浙江千克知识产权代理有限公司 33246	代理人：	赵芳;张瑜
地址：	310012 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种面向司法文本的搜索排序方法及系统，其中该方法包括(1)数据预处理：收集司法文本数据Doc和法律咨询问题Query，并将收集的司法文本数据Doc进行分词处理，利用分词后的数据预训练司法文本词向量；(2)构建相似度矩阵：采用预训练的词向量构建Query和Doc的相似度匹配矩阵M；(3)截取相关性文本片段：根据Query和Doc的匹配矩阵M提取局部相关性文本片段，多个局部相关性文本片段拼接在一起获得相关性文本Ds，对应的多个局部相关性文本片段的匹配矩阵拼接在一起获得矩阵Ms；(4)构建特征向量：计算Query和相关性文本Ds的全局相关性，构建特征向量F；(5)计算匹配值并排序：将获得的特征向量F输入到神经网络模型中，得到Query和Doc的匹配score，根据匹配score大小进行排序。
搜索关键词：	一种面向司法文本搜索排序方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种面向司法文本的搜索排序方法，其步骤如下：(1)数据预处理：收集司法文本数据Doc和法律咨询问题Query，并将收集的司法文本数据Doc进行分词处理，再根据分词后的数据预训练司法文本词向量；(2)构建相似度矩阵：采用预训练的司法文本词向量构建Query和Doc的相似度匹配矩阵M；(3)截取相关性文本片段：在Query和Doc的相似度匹配矩阵M提取局部相关性文本片段，多个局部相关性文本片段拼接在一起获得相关性文本Ds，对应的多个局部相关性文本片段的匹配矩阵拼接在一起获得矩阵Ms；(4)构建特征向量：计算Query和相关性文本Ds的全局相关性，构建特征向量F；(5)计算匹配值并排序：将获得的特征向量F输入到神经网络模型中，得到最终的Query和Doc的匹配score，然后根据匹配score大小进行排序。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于银江股份有限公司，未经银江股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910554551.5/，转载请声明来源钻瓜专利网。

上一篇：一种基于人工智能的专业知识问答机器人系统
下一篇：一种语料处理方法、装置、存储介质及电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向司法文本的搜索排序方法及系统有效

专利文献下载