[发明专利]问答匹配方法和装置有效
申请号: | 201910491204.2 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110209790B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 张望舒;温祖杰 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 匹配 方法 装置 | ||
1.一种问答匹配方法,所述方法包括:
针对当前用户问句进行句子主干提取,生成所述当前用户问句对应的当前句子主干;
根据所述当前句子主干,从预先建立的映射表中查找所述当前句子主干对应的当前知识点标题;所述映射表基于被标注为回答错误的历史问句建立;
若查找到所述当前句子主干对应的当前知识点标题,则将所述当前知识点标题作为预先训练的通用问答模型的输入,通过所述通用问答模型的输出得到所述当前用户问句对应的第一目标答案;
若未查找到所述当前句子主干对应的当前知识点标题,则将所述当前用户问句作为预先训练的通用问答模型的输入,通过所述通用问答模型的输出得到所述当前用户问句对应的第二目标答案;
获取所述当前用户问句与所述第二目标答案是否匹配的打标结果;
若所述打标结果指示所述当前用户问句与所述第二目标答案不匹配,则获取所述当前用户问句对应的当前句子主干,以及获取标注的所述当前用户问句对应的当前知识点标题,将所述当前句子主干与所述当前知识点标题的映射关系加入所述映射表。
2.如权利要求1所述的方法,其中,所述获取所述当前用户问句与所述第二目标答案是否匹配的打标结果之前,所述方法还包括:
确定接收到针对所述当前用户问句的转为人工服务的指令;或者,
确定所述当前用户问句属于预先设定的需要紧急修复的场景。
3.如权利要求1所述的方法,其中,所述将所述当前句子主干与所述当前知识点标题的映射关系加入所述映射表之后,所述方法还包括:
为该映射关系设定生效时间,当超过所述生效时间后,从所述映射表中删除该映射关系。
4.如权利要求3所述的方法,其中,所述方法还包括:
若所述生效时间的时间长度大于预设长度阈值,则将该映射关系用于对所述通用问答模型进行训练时的一组训练样本。
5.如权利要求1所述的方法,其中,所述针对当前用户问句进行句子主干提取,包括:
确定所述当前用户问句中的包含的各主干词;
根据各主干词生成所述当前用户问句对应的当前句子主干。
6.如权利要求5所述的方法,其中,所述确定所述当前用户问句中的包含的各主干词,包括:
对所述当前用户问句进行分词处理和去停用词处理,得到第一分词组;
对所述第一分词组中的各分词使用强同义词进行归一化替换,得到第二分词组,将第二分词组中的各分词确定为主干词。
7.如权利要求5所述的方法,其中,所述确定所述当前用户问句中的包含的各主干词,包括:
对所述当前用户问句进行分词处理和去停用词处理,得到第一分词组;
对所述第一分词组中的各分词经过词嵌入后,作为预先训练的序列标注模型的输入,通过所述序列标注模型的输出得到各分词是否为主干词的预测概率;
将各分词中预测概率大于预设概率阈值的分词,确定为所述当前用户问句的主干词。
8.如权利要求5所述的方法,其中,所述根据各主干词生成所述当前用户问句对应的当前句子主干,包括:
判断所述当前用户问句中是否包含预定的表示方向性的词;
如果所述当前用户问句中包含预定的表示方向性的词,则将各主干词按照其在所述当前用户问句中的位置关系进行排序;
如果所述当前用户问句中不包含预定的表示方向性的词,则将各主干词按照预定的位置关系进行排序;
将排序后的各主干词组合成所述当前用户问句对应的当前句子主干。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910491204.2/1.html,转载请声明来源钻瓜专利网。