[发明专利]叠字类问题处理方法、处理装置、设备及存储介质有效
| 申请号: | 201910511968.3 | 申请日: | 2019-06-13 |
| 公开(公告)号: | CN110222186B | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 郭建廷;岳聪 | 申请(专利权)人: | 出门问问信息科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332 |
| 代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 李伟波;韩德凯 |
| 地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 叠字 问题 处理 方法 装置 设备 存储 介质 | ||
1.一种叠字类问题处理方法,其特征在于,包括:
将目标问题的汉字表达转换为数学表达,使用经过机器学习算法训练的二分类数学模型对所述目标问题的数学表达进行叠字类问题概率分析和非叠字类问题概率分析,如果叠字类问题概率大于非叠字类问题概率,则将所述目标问题判断为叠字类问题;
如果目标问题是叠字类问题,则将目标问题的汉字表达转换为数学表达,使用经过机器学习算法训练的标注数学模型对所述目标问题的数学表达进行标注,输出每个汉字的类型标签,基于每个汉字的类型标签,提取出目标问题的重复个数的类型标签对应的汉字和目标问题的重复单字的类型标签对应的汉字;如果目标问题不是叠字类问题,则不对目标问题进行标注;
在叠字知识库中查找所述目标问题的重复个数和重复单字,获得重复个数和重复单字对应的目标叠字;所述叠字知识库将每个叠字存储为三要素表达:重复个数-重复单字-目标叠字;
基于目标问题的重复个数、重复单字、目标叠字以及答案模板,生成目标答案。
2.一种叠字类问题处理装置,其特征在于,
判断装置,所述判断装置将目标问题的汉字表达转换为数学表达,使用经过机器学习算法训练的二分类数学模型对所述目标问题的数学表达进行叠字类问题概率分析和非叠字类问题概率分析,如果叠字类问题概率大于非叠字类问题概率,则将所述目标问题判断为叠字类问题;
标注装置,如果目标问题是叠字类问题,则将目标问题的汉字表达转换为数学表达,使用经过机器学习算法训练的标注数学模型对所述目标问题的数学表达进行标注,输出每个汉字的类型标签,基于每个汉字的类型标签,提取出目标问题的重复个数的类型标签对应的汉字和目标问题的重复单字的类型标签对应的汉字;如果目标问题不是叠字类问题,则所述标注装置不对目标问题进行标注;以及
获取装置,在叠字知识库中查找所述目标问题的重复个数和重复单字,获得重复个数和重复单字对应的目标叠字;所述叠字知识库将每个叠字存储为三要素表达:重复个数-重复单字-目标叠字;基于目标问题的重复个数、重复单字、目标叠字以及答案模板,生成目标答案。
3.一种电子设备,其特征在于,包括:
存储器,所述存储器存储执行指令;以及
处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行如权利要求1所述的方法。
4.一种可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现如权利要求1所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910511968.3/1.html,转载请声明来源钻瓜专利网。





