[发明专利]基于法律语义件与文书大数据统计分析的法律咨询系统在审
申请号: | 201910540187.7 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110059193A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 丁琦;杜向阳;郑茂盛;王义真 | 申请(专利权)人: | 南京擎盾信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/36 |
代理公司: | 苏州拓云知识产权代理事务所(普通合伙) 32344 | 代理人: | 潘好帅 |
地址: | 210000 江苏省南京市雨花台*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法律咨询 语义 法律问题 用户提供 咨询报告 统计分析 大数据 自然语言 神经网络模型 动态生成 法律文本 交互方式 司法领域 文书数据 信息抽取 专家系统 自然文本 定制化 固定的 口语化 多轮 录入 标注 问卷 法律 裁判 答案 引入 咨询 司法 | ||
1.基于法律语义件与文书大数据统计分析的法律咨询系统,其包括专家知识库模块、领域识别模块、意图检测模块、槽填充模块、文本信息抽取模块、文本相似度计算模块和用户交互模块,其特征在于,
所述专家知识库模块为各个模块提供数据支撑;
所述领域识别模块负责实现自动识别用户输入所对应的法律领域;
所述意图检测模块负责实现自动检测用户输入所包含的行为目标,且所述意图检测模块与所述领域识别模块连接;
所述槽填充模块实现自动选槽并追问用户,从用户输入中获取为了解答用户问题所需的各项信息,所述槽填充模块与所述意图检测模块连接;
所述文本信息抽取模块实现从非结构化的裁判文书中自动提取结构化信息,其包括数据爬取、文本清洗和实体抽取,其中,非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据;
所述文本相似度计算模块用于实现从海量文书中获取与用户情形最相似的案例的功能,所述文本相似度计算模块与所述槽填充模块连接;
所述用户交互模块用于获取用户输入,使用领域识别模块中训练好的CNN神经网络进行分类,取概率最高的一个分类作为用户输入指涉的案由,并由意图检测模块识别出相应的意图,根据用户意图匹配对应的槽模板,使用用户输入进行槽填充,如未填充完成,则根据空槽进行追问,直至槽填充完成,且从槽中获取用户案情的特征值,由文本相似度计算模块计算出类案,根据意图检测模块识别出的用户意图,匹配专家规则,从类案中统计出特定的指标来生成诉讼指引。
2.根据权利要求1所述的基于法律语义件与文书大数据统计分析的法律咨询系统,其特征在于,所述专家知识库模块包括构建法律词典、构建法律实体、构建法律关系和构建法律知识图谱。
3.根据权利要求1所述的基于法律语义件与文书大数据统计分析的法律咨询系统,其特征在于,所述领域识别模块从人工标注好分类的口语化及书面化文本中抽取特征信息编码为词向量形成训练集,并采用卷积神经网络训练文本分类器。
4.根据权利要求1所述的基于法律语义件与文书大数据统计分析的法律咨询系统,其特征在于,所述槽填充模块为序列标注模型针对不同的意图设计标签,且根据不同法律问题的复杂度不同,每个意图对应3~7个语义标签;
且所述槽填充模块为构造数据集,采用循环神经网络实现槽填充模型,对搜集来的口语化或规范化的法律文本,采用机器根据规则预标注,人工后期校验的方式生成数据集,保留其中15%的样本作为测试集;
所述槽填充模块按时间顺序对来自对话历史的上下文编码,加入RNN的隐藏层用以消除歧义,其中,隐藏层是把输入数据的特征,抽象到另一个维度空间,来展现其更抽象化的特征,这些特征能更好的进行线性划分。
5.根据权利要求4所述的基于法律语义件与文书大数据统计分析的法律咨询系统,其特征在于,所述数据爬取负责从中国裁判文书网等政务网站及司法公开平台获取千万级裁判文书文本;
所述文本清洗负责从政府公开网站途径获取国标数据,包括行政区划,法院,案由信息以及预设裁判文书分段、案由、地理信息抽取规则,将抽取内容与基础数据比对后进行结构化;
实体抽取是在知识图谱法律实体上预置一定的专家规则,据此从文本中抽取一定量附带上下文信息的短句,结合自然语言处理的词性标注与句法依存分析等方法,对文本进行实体标注。
6.根据权利要求1所述的基于法律语义件与文书大数据统计分析的法律咨询系统,其特征在于,所述文本相似度计算模块包括获取用户案情的特征值,用户案情的特征值分为离散型特征与连续性特征;由专家提前制定好对应的过滤型特征与非过滤型特征的权重,并从文书库中先按过滤型特征筛选出子集,针对特征类型与权重对子集的文本进行打分,取打分高于阈值的文本作为类案。
7.根据权利要求1所述的基于法律语义件与文书大数据统计分析的法律咨询系统,其特征在于,所述用户交互模块包含案件胜败诉率分析模型、证据模型分析模型、行动建议模型、法律规范模型和类似案例模型;其中,
案件胜败诉率模型负责根据用户信息生成案情画像,匹配最贴切的类似案例,统计案件结果生成胜败诉率,分析败诉原因及应对方案,其中,案情画像是基于裁判文书中事实、诉讼请求、证据、争议焦点等法律要素而构成的法律知识图谱;
证据模型分析是根据当事人的案情针对性地提示证据材料,明确各类证据的效力等级,同时增减证据种类,动态化展示案件的胜诉率;
行动建议模型根据用户案情要素,基于日常解纷流程,为其提供从简到繁、从易到难、切实有效的解纷行动建议;
法律规范模型负责结合案情,推送相关法律法规、司法解释、规章、政策尽可能多的法律规范,帮助当事人全面了解案情事实的法律依据;
类似案例模型负责推荐与当事人案情基本事实、争议焦点方面高度相似的裁判文书,着重突出裁判观点中对案件的说理,为当事人提供诉讼依据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京擎盾信息科技有限公司,未经南京擎盾信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910540187.7/1.html,转载请声明来源钻瓜专利网。