[发明专利]自动问答方法、装置、电子设备和存储介质有效
| 申请号: | 201910584837.8 | 申请日: | 2019-07-01 |
| 公开(公告)号: | CN110309285B | 公开(公告)日: | 2022-03-29 |
| 发明(设计)人: | 郭建廷;岳聪 | 申请(专利权)人: | 出门问问信息科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/289;G06F40/295 |
| 代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
| 地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自动 问答 方法 装置 电子设备 存储 介质 | ||
1.一种自动问答方法,其特征在于,所述方法包括:
获取待分类问题;
通过预训练的分类模型和分类规则确定所述待分类问题的类别,所述类别包括叠字类问题和非叠字类问题;以及
响应于所述待分类问题的类别为叠字类问题,在叠字信息数据库中获取所述叠字类问题的答案;
其中,所述分类模型的训练过程为:
获取第一训练集,所述第一训练集包括多个叠字类问题和对应的第一标签;
获取第二训练集,所述第二训练集包括多个非叠字类问题和对应的第二标签;以及
根据所述第一训练集和所述第二训练集按照机器学习算法训练获取分类模型;
其中,根据所述分类模型和分类规则确定待分类问题的类别包括:
根据分类模型获取待分类问题的第一概率,所述第一概率为所述待分类问题为叠字类问题的概率;
根据分类规则获取待分类问题的第二概率,所述第二概率为所述待分类问题满足分类规则的概率;
根据所述第一概率、第二概率和预先设置的第一权重和第二权重计算类别概率,所述类别概率用于表征所述待分类问题为叠字类问题的概率;以及
响应于所述类别概率的值大于预定阈值,将所述待分类问题的类别确定为叠字类问题。
2.根据权利要求1所述的方法,其特征在于,所述分类规则包括待分类问题的文本信息的最大字数阈值、最小字数阈值、相同字符的重复次数、实体人名包含状态和英文字母包含状态中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述机器学习算法为最大熵算法、支持向量机算法或者神经网络分类算法。
4.根据权利要求1所述的方法,其特征在于,所述叠字信息数据库包括多个叠字的信息,所述叠字的信息包括重复次数、重复单字和目标叠字。
5.一种自动问答装置,其特征在于,所述装置包括:
问题获取单元,用于获取待分类问题;
类别确定单元,用于通过预训练的分类模型和分类规则确定所述待分类问题的类别,所述类别包括叠字类问题和非叠字类问题;以及
答案确定单元,用于响应于所述待分类问题的类别为叠字类问题,在叠字信息数据库中获取所述叠字类问题的答案;
其中,所述分类模型的训练过程为:
获取第一训练集,所述第一训练集包括多个叠字类问题和对应的第一标签;
获取第二训练集,所述第二训练集包括多个非叠字类问题和对应的第二标签;以及
根据所述第一训练集和所述第二训练集按照机器学习算法训练获取分类模型;
其中,所述类别确定单元用于:
根据分类模型获取待分类问题的第一概率,所述第一概率为所述待分类问题为叠字类问题的概率;
根据分类规则获取待分类问题的第二概率,所述第二概率为所述待分类问题满足分类规则的概率;
根据所述第一概率、第二概率和预先设置的第一权重和第二权重计算类别概率,所述类别概率用于表征所述待分类问题为叠字类问题的概率;以及
响应于所述类别概率的值大于预定阈值,将所述待分类问题的类别确定为叠字类问题。
6.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-4中任一项所述的方法。
7.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-4中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910584837.8/1.html,转载请声明来源钻瓜专利网。





