[发明专利]基于弱监督学习和联合学习机制的法律问答方法及设备有效
申请号: | 202110474027.4 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113297360B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 朵思惟;余梓飞;张程华 | 申请(专利权)人: | 天津汇智星源信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06Q50/18 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 孙晓凤 |
地址: | 300384 天津市滨海新区华苑产*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 联合 机制 法律 问答 方法 设备 | ||
本公开提供一种基于弱监督学习和联合学习机制的法律问答方法及设备。该方法包括:获取用户输入的法律问题;利用预先构建的多标签分类模型和预设的法律标签集合,基于联合学习机制对所述法律问题进行分类,以得到所述法律问题的法律标签;从法律问答对数据库中检索出与所述法律标签相关联的候选法律问答对;输出至少一个所述候选法律问答对中的答案作为对所述法律问题的答复。本公开提供的基于弱监督学习和联合学习机制的法律问答方法及设备,针对口语化的提问方式给出了一套法律咨询的智能问答方法,改善了传统方法不能很好的识别和理解口语化法律问题并将其意图进行精准分类的缺陷。
技术领域
涉及人工智能技术领域,尤其涉及一种基于弱监督学习和联合学习机制的法律问答方法及设备。
背景技术
随着我国经济社会的不断发展,人民群众的民主法制意识逐渐增强,法律咨询的需求也日益增多。由于律师和专业法律从业人员的资源紧缺,很多咨询不能得到及时准确的回复。人工智能在法律领域的应用为法律咨询市场供需不平衡的问题提供了可行的解决方案。
法律咨询过程中,当事人大多是通过口语化的表达方式对法律问题进行法律问题,表述中往往不包含相关的法律专业词汇。传统的方式通过将用户咨询的问题和法律关键词词典进行匹配来分析用户问题的意图,然后将对应问题的答案推送给用户。但由于用户提问大多偏向口语化,多数情况下并不能将一段口语化的法律问题准确地解析为相对应的法律术语,因此在实际场景的应用中有很大的局限性。
发明内容
有鉴于此,本公开的目的在于提出一种基于弱监督学习和联合学习机制的法律问答方法及设备。
基于上述目的,本公开提供了一种法律问答方法,包括:
获取用户输入的法律问题;
利用预先构建的多标签分类模型和预设的法律标签集合,基于联合学习机制对所述法律问题进行分类,以得到所述法律问题的法律标签;
从法律问答对数据库中检索出与所述法律标签相关联的候选法律问答对;
输出至少一个所述候选法律问答对中的答案作为对所述法律问题的答复,
其中,所述多标签分类模型是经过基于弱监督学习的预训练和基于强监督学习的训练的。
进一步的,基于联合学习机制对所述法律问题进行分类以得到所述法律问题的法律标签包括:
利用分词算法对所述法律问题进行分词处理;
利用第一BERT预训练模型分别对经过分词处理的所述法律问题和所述法律标签集合进行嵌入,以得到所述法律问题的词向量序列和所述法律标签集合的标签向量序列;
对于所述词向量序列中的每个词向量,分别计算该词向量与所述标签向量序列中的各个标签向量的余弦相似度,并确定所述余弦相似度中的最大值作为该词向量的权重系数;
基于所述词向量序列中的各个词向量的所述权重系数,得到所述法律问题的加权向量表示;
对所述加权向量表示和所述法律标签集合应用多标签分类算法,以得到所述法律标签集合的针对所述法律问题的得分向量;
确定所述得分向量中数值超过预设阈值的分量作为目标分量;
将所述法律标签集合中与所述目标分量对应的法律标签作为所述法律问题的法律标签。
进一步的,输出至少一个所述候选法律问答对中的答案作为对所述法律问题的答复包括:
对于所述候选法律问答对中的每一个候选法律问答对,通过第二BERT预训练模型得到该候选法律问答对中的问句与所述法律问题的语义相似度;
将得到的多个所述语义相似度按从大到小的顺序排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津汇智星源信息技术有限公司,未经天津汇智星源信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110474027.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:便携式随钻测试伺服控制方法及设备
- 下一篇:一种河道漂流物视觉检测方法和装置