[发明专利]法律文书定位方法、装置、设备及存储介质有效
申请号: | 202110304076.3 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112989820B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 刘璐 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06Q50/18;G10L15/26 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法律文书 定位 方法 装置 设备 存储 介质 | ||
1.一种法律文书定位方法,其特征在于,所述法律文书定位方法包括:
当接收到文书定位请求时,根据所述文书定位请求确定目标案件,并根据所述目标案件获取法律文书;
对所述法律文书进行预处理,得到文本数据,包括:对所述法律文书进行分词处理,得到文书分词;确定所述文书分词在所述法律文书中的分词位置,并将所述文书分词转换为文书向量;根据所述分词位置依次将所述文书向量输入至预先训练好的文本纠错模型中,得到待修正词及候选词;当检测到用户触发所述候选词时,将所述法律文书中的所述待修正词替换为所述候选词,得到修正文书;确定所述修正文书的文书格式,并检测所述文书格式是否为预设格式;若所述文书格式不为所述预设格式,将所述修正文书的所述文书格式转换为所述预设格式,得到所述文本数据;
分析所述文本数据,得到所述文本数据的文本标签;
根据所述文本标签对所述文本数据进行要素抽取,得到子标签及特征信息;
确定所述特征信息在所述法律文书中的位置,并根据所述子标签及所述位置建立映射关系,得到文书列表;
根据所述文书定位请求获取语音信息,并根据所述语音信息提取证据特征,所述证据特征是指所述语音信息中的关键信息;
根据所述证据特征从所述文书列表中确定证据位置。
2.如权利要求1所述的法律文书定位方法,其特征在于,所述分析所述文本数据,得到所述文本数据的文本标签包括:
对所述文本数据进行分词处理,得到数据分词;
对所述数据分词进行编码,得到与所述数据分词对应的分词向量;
对所述分词向量进行上下文特征提取,得到与所述分词向量对应的语义向量;
拼接所述分词向量及所述语义向量,得到所述数据分词的特征向量;
对所述特征向量进行映射处理,得到所述数据分词在所述特征向量中每个维度的概率;
将所述概率最大的维度确定为目标维度,并从标签库中将与所述目标维度对应的类别确定为所述文本标签,其中,所述标签库中存储有多个维度对应的标签。
3.如权利要求2所述的法律文书定位方法,其特征在于,所述根据所述文本标签对所述文本数据进行要素抽取,得到子标签及特征信息包括:
获取所述文本标签中所有二级标签作为所述子标签;
确定所述分词向量的编码表,并从所述编码表中获取每个子标签的标签向量;
计算所述特征向量与每个标签向量的相似度;
将所述相似度大于预设阈值的数据分词确定为所述子标签对应的所述特征信息。
4.如权利要求1所述的法律文书定位方法,其特征在于,所述根据所述文书定位请求确定目标案件包括:
解析所述文书定位请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取指示案件的信息作为案件编号;
将所述案件编号写入查询模板中,得到查询语句;
运行所述查询语句,得到所述目标案件。
5.如权利要求4所述的法律文书定位方法,其特征在于,所述根据所述文书定位请求获取语音信息包括:
从所述数据信息中获取指示通道的信息作为通道编码;
将与所述通道编码对应的信息确定为连接通道;
获取所述文书定位请求的生成时间;
从所述连接通道中获取与所述生成时间对应的语音作为所述语音信息。
6.如权利要求5所述的法律文书定位方法,其特征在于,所述根据所述语音信息提取证据特征包括:
利用语音识别算法识别所述语音信息,得到目标语句;
对所述目标语句进行分词处理,得到目标分词;
确定所述目标分词在所述目标语句中的词性;
将所述词性为预设词性的目标分词确定为所述证据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304076.3/1.html,转载请声明来源钻瓜专利网。