[发明专利]基于弱监督学习和联合学习机制的法律问答方法及设备有效
| 申请号: | 202110474027.4 | 申请日: | 2021-04-29 |
| 公开(公告)号: | CN113297360B | 公开(公告)日: | 2022-05-27 |
| 发明(设计)人: | 朵思惟;余梓飞;张程华 | 申请(专利权)人: | 天津汇智星源信息技术有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06Q50/18 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 孙晓凤 |
| 地址: | 300384 天津市滨海新区华苑产*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 监督 学习 联合 机制 法律 问答 方法 设备 | ||
1.一种法律问答方法,包括:
获取用户输入的法律问题;
利用预先构建的多标签分类模型和预设的法律标签集合,基于联合学习机制对所述法律问题进行分类,以得到所述法律问题的法律标签,
利用分词算法对所述法律问题进行分词处理;
利用第一BERT预训练模型分别对经过分词处理的所述法律问题和所述法律标签集合进行嵌入,以得到所述法律问题的词向量序列和所述法律标签集合的标签向量序列;
对于所述词向量序列中的每个词向量,分别计算该词向量与所述标签向量序列中的各个标签向量的余弦相似度,并确定所述余弦相似度中的最大值作为该词向量的权重系数;
基于所述词向量序列中的各个词向量的所述权重系数,得到所述法律问题的加权向量表示;
对所述加权向量表示和所述法律标签集合应用多标签分类算法,以得到所述法律标签集合的针对所述法律问题的得分向量;
确定所述得分向量中数值超过预设阈值的分量作为目标分量;
将所述法律标签集合中与所述目标分量对应的法律标签作为所述法律问题的法律标签;
从法律问答对数据库中检索出与所述法律标签相关联的候选法律问答对;
输出至少一个所述候选法律问答对中的答案作为对所述法律问题的答复,
其中,所述多标签分类模型是经过基于弱监督学习的预训练和基于强监督学习的训练的。
2.根据权利要求1所述的方法,其中,输出至少一个所述候选法律问答对中的答案作为对所述法律问题的答复包括:
对于所述候选法律问答对中的每一个候选法律问答对,通过第二BERT预训练模型得到该候选法律问答对中的问句与所述法律问题的语义相似度;
将得到的多个所述语义相似度按从大到小的顺序排序;
选取排序后的多个所述语义相似度中的前n个语义相似度作为目标语义相似度,其中n为预设整数;
输出所述候选法律问答对中与所述目标语义相似度对应的候选法律问答对中的答案作为对所述法律问题的答复。
3.根据权利要求1所述的方法,其中,所述基于弱监督学习的预训练包括:
对于多个未标注法律问答对中的每一个未标注法律问答对,将该未标注法律问答对中的答案与所述法律标签集合进行正则匹配,确定与该答案匹配的法律标签作为该未标注法律问答对中的问句的伪标签,并将该问句和该伪标签的组合作为标注训练数据来训练所述多标签分类模型。
4.根据权利要求3所述的方法,其中,将该问句和该伪标签的组合作为标注训练数据来训练所述多标签分类模型包括:
利用所述多标签分类模型和所述法律标签集合,基于联合学习机制对所述问句进行分类,以得到所述问句的预测标签;
计算所述伪标签与所述预测标签之间的交叉熵损失函数;
调整所述多标签分类模型的参数以最小化所述交叉熵损失函数。
5.根据权利要求1所述的方法,其中,所述基于强监督学习的训练包括:
对于多个标注法律问答对中的每一个标注法律问答对,
利用经过所述基于弱监督学习的预训练的所述多标签分类模型和所述法律标签集合,基于联合学习机制对该标注法律问答对中的问句进行分类,以得到该问句的预测标签;
计算该问句的真实标签与所述预测标签之间的交叉熵损失函数;
调整经过所述基于弱监督学习的预训练的所述多标签分类模型的参数以最小化所述交叉熵损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津汇智星源信息技术有限公司,未经天津汇智星源信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110474027.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:便携式随钻测试伺服控制方法及设备
- 下一篇:一种河道漂流物视觉检测方法和装置





