[发明专利]智能问答方法、装置、计算机设备和存储介质在审
申请号: | 202011628642.8 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112765306A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 吕海峰;宁可;宁义双;彭璐 | 申请(专利权)人: | 金蝶软件(中国)有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/332;G06F16/33;G06F40/216;G06F40/30 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 魏宇星 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 问答 方法 装置 计算机 设备 存储 介质 | ||
1.一种智能问答方法,其特征在于,所述方法包括:
接收客户端输入的待回答问题文本;
从问答库中获取至少两个与所述待回答问题文本匹配的候选问题文本;
在所述候选问题文本中,通过排序模型确定与所述待回答问题文本相似度最大的目标问题文本;
当所述目标问题文本与所述待回答问题文本间的相似度大于相似度阈值时,向所述客户端反馈所述目标问题文本对应的第一回复文本;
当所述目标问题文本与所述待回答问题文本间的相似度小于或等于所述相似度阈值时,向所述客户端反馈关键词提示列表;当接收到所述客户端在所述关键词提示列表中选取的问题关键词时,向所述客户端反馈与所述问题关键词匹配的第二回复文本。
2.根据权利要求1所述的方法,其特征在于,所述从问答库中获取至少两个与所述待回答问题文本匹配的候选问题文本,包括:
对所述待回答问题文本进行分词处理,得到待检索分词;
从分词索引列表中查询与所述待检索分词对应的索引编号;
从所述问答库的问答文档中提取所述索引编号对应的候选问题文本;
计算所述候选问题文本与所述待回答问题文本间的匹配度;
将所述匹配度达到匹配阈值时对应的至少两个候选问题文本,作为与所述待回答问题文本匹配的候选问题文本。
3.根据权利要求1所述的方法,其特征在于,所述第一回复文本为答案信息、或目标文档中包含所述答案信息的句子文本、或所述句子文本在所述目标文档中所属段落的段落文本;所述方法还包括:
查找所述问答库的问答文档中与所述目标问题文本匹配的答案信息;或者,
查找所述问答库的问答文档中与所述目标问题文本匹配的句子文本;或者;
在查找到所述问答库的问答文档中与所述目标问题文本匹配的句子文本时,确定所述句子文本在所述目标文档中所属段落的段落文本。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对所述问答文档中的每个问题文本进行分词处理,得到与每个所述问题文本对应的问题词组;
为每个所述问题词组分配对应的索引编号;
根据所述索引编号与所述问题词组构建所述分词索引列表。
5.根据权利要求4所述的方法,其特征在于,每个所述问题词组包含多个问题分词;所述根据所述索引编号与所述问题词组构建所述分词索引列表,包括:
根据所述索引编号和所述问题词组构建映射列表;
在所述映射列表的问题词组中,确定每个问题分词所映射的目标索引编号;
以所述目标索引编号对应的问题分词为键,以所述目标索引编号为值构建所述分词索引列表。
6.根据权利要求1所述的方法,其特征在于,所述问答库包括问答文档;所述方法还包括:
获取目标文档,并对所述目标文档进行分段处理,得到候选段落文本;
对所述候选段落文本进行分句处理,得到候选句子文本;
通过问题生成模型对所述候选句子文本进行处理,得到候选答案信息和所述候选答案信息对应的候选问题文本;所述候选句子文本是所述候选答案信息在所述目标文档所属句子的文本;
构建包含所述候选问题文本、所述候选答案信息和所述候选句子文本的问答文档。
7.根据权利要求6所述的方法,其特征在于,所述通过问题生成模型对所述候选句子文本进行处理,得到候选答案信息和所述候选答案信息对应的候选问题文本,包括:
通过所述问题生成模型对所述候选句子文本进行随机解码预测,得到所述候选答案信息;
通过所述问题生成模型对所述候选答案信息以及所述候选句子文本进行确定性解码预测,得到所述候选问题文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金蝶软件(中国)有限公司,未经金蝶软件(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011628642.8/1.html,转载请声明来源钻瓜专利网。