[发明专利]法律文书处理方法及装置有效
| 申请号: | 201811142824.7 | 申请日: | 2018-09-28 |
| 公开(公告)号: | CN110991164B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 石鹏;王福伟 | 申请(专利权)人: | 北京国双科技有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/253;G06F40/279 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 法律文书 处理 方法 装置 | ||
1.一种法律文书处理方法,其特征在于,包括:
获得待处理的法律文书中的多个自然段落;
通过机器学习方法确定获得的各所述自然段落归属的文书部分;
对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组,其中,同一段落组中各自然段落归属的文书部分相同,位于不同段落组中的自然段落归属的文书部分不同;
对任一段落组:确定该段落组中各自然段落的段号中的最小段号和最大段号,将段号位于所述最小段号和所述最大段号以内的各自然段落确定为该段落组对应的待分析段落;
确定该段落组对应的待分析段落否均归属同一文书部分,如果是,则确定该段落组对应的各待分析段落归属的文书部分正确;否则,确定该段落组对应的待分析段落中存在至少一个自然段落需要校正。
2.根据权利要求1所述的方法,其特征在于,在所述确定该段落组对应的待分析段落中存在至少一个自然段落需要校正之后,所述方法还包括:
为该段落组对应的各待分析段落添加待人工校正标识;
或者,根据第一统计结果及该段落组对应的各待分析段落在法律文书中的排列顺序,确定该段落组对应的待分析段落中的待校正段落,对所述待校正段落进行校正处理,其中,所述第一统计结果为该段落组对应的各待分析段落归属的文书部分的统计结果。
3.根据权利要求2所述的方法,其特征在于,所述根据第一统计结果及该段落组对应的各待分析段落在法律文书中的排列顺序,确定该段落组对应的待分析段落中的待校正段落,包括:
确定第一段落子组中自然段落的数量为第一数量,确定第二段落子组中自然段落的数量为第二数量,其中,所述第一段落子组中各自然段落依次相邻且均归属于该段落组对应的文书部分,所述第二段落子组中各自然段落依次相邻且均归属于该段落组对应的文书部分,所述第一段落子组中包括所述最小段号的自然段落,所述第二段落子组中包括所述最大段号的自然段落;
将该段落组对应的各待分析段落归属的各文书部分中除该段落组对应的文书部分外的其他文书部分确定为待分析部分Li,其中,该段落组对应的文书部分为该段落组中各自然段落归属的文书部分;
对任一待分析部分Li:确定第i段落子组中自然段落的数量为第i数量,其中,所述第i段落子组中各自然段落依次相邻且均归属于Li,i为待分析部分的序号,i为自然数且i大于2;
在所述第一数量和所述第二数量均大于所述第i数量时,将归属于该Li的各待分析段落确定为待校正段落。
4.根据权利要求3所述的方法,其特征在于,所述对所述待校正段落进行校正处理,包括:
将各待校正段落归属的文书部分校正为:该段落组对应的文书部分。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
对至少一个段落组:将该段落组中各自然段落的文本格式设置为与该段落组对应的文书部分匹配的文本格式。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述通过机器学习方法确定获得的各所述自然段落归属的文书部分,包括:
将获得的各所述自然段落输入预设的机器学习模型中,获得所述机器学习模型输出的各所述自然段落归属的文书部分,其中,所述机器学习模型是对预设训练数据进行机器学习得到的,所述预设训练数据为:已确定各自然段落所归属的文书部分的法律文书。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811142824.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于用户等级的共享单车开锁方法
- 下一篇:文本修正方法、设备及介质





