[发明专利]智能语音问答方法、装置、计算机设备和可读存储介质在审
申请号: | 201710628166.1 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107688608A | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | 闫永刚;沈亮 | 申请(专利权)人: | 合肥美的智能科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京友联知识产权代理事务所(普通合伙)11343 | 代理人: | 尚志峰,汪海屏 |
地址: | 230601 安徽省合肥市经*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 语音 问答 方法 装置 计算机 设备 可读 存储 介质 | ||
技术领域
本发明涉及人机智能交互技术领域,具体而言,涉及一种智能语音问答方法、一种智能语音问答装置、一种计算机设备和一种计算机可读存储介质。
背景技术
智能问答系统是综合运用了自然语言处理、信息检索、语义分析和人工智能等技术的一种新型的信息服务系统。
相关技术中,智能问答系统大多基于开放领域和传统问答标准框架,存在以下技术缺陷:
(1)开放领域的问答系统需要超大规模的知识库作基础,其直接运用到限定领域中存在着冷启动、无法匹配正确答案等问题,同时用户的检索问题大多都是口语化表述,完全依靠限定领域的资料生成模型与检索问题不符,因此很难直接获取到用户所需答案。
(2)当前的问答系统大多不能够精准理解用户的自然语言问题意图,用户的情感倾向没有得到充分体现。
(3)答案抽取大多是基于词频相似度的计算或其他复杂的机器学习模型,然而这种答案抽取方式不仅计算量大,而且面对高度稀疏的问题解时,答案抽取精度也将大打折扣。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提供一种智能语音问答方法。
本发明的另一个目的在于提供一种智能语音问答装置。
本发明的再一个目的在于提供一种计算机设备。
本发明的又一个目的在于提供一种计算机可读存储介质。
为了实现上述目的,本发明的第一方面的技术方案提供了一种智能语音问答方法,包括:获取待回答语句;确定待回答语句的至少一个标签;在预设数据库中,根据至少一个标签确定待回答语句的匹配集合;基于K最近邻分类模型,确定与待回答语句相对应的匹配集合内的k个语句;根据预设规则计算待回答语句与k个语句中的每一语句的匹配度;根据匹配度的大小,对k个语句进行排序,并按照顺序依次输出k个语句对应的答案信息作为待回答语句的答案信息。
在该技术方案中,通过确定获取到的待回答语句的至少一个标签,然后在预设数据库中,根据至少一个标签确定待回答语句的匹配集合,提高了对用户问询意图识别的准确度,缩小了答案信息的抽取范围,提高答案信息抽取的准确性,通过基于K最近邻分类模型,确定与待回答语句相对应的匹配集合内的k个语句,进一步找到了待回答语句的匹配邻近k个语句,有利于进一步节约后台计算资源,通过根据预设规则计算待回答语句与k个语句中的每一语句的匹配度,提高了匹配度的准确性,通过根据匹配度的大小,对k个语句进行排序,并按照顺序依次输出k个语句对应的答案信息作为待回答语句的答案信息,进一步提高了答案信息抽取的准确性,进而提升了语音问答的智能化水平。
其中,获取待回答语句时,可以设为接收限定时间的语音输入,比如时间限定为30s,使得待回答语句为短文本类型的语句,可以有利于准确抽取答案信息的实现。
另外,确定的待回答语句的标签可以是句法标签,情感标签,领域标签中的一个,也可以句法标签,情感标签,领域标签的任意组合。
句法标签是根据预先构建训练的句法标签预测模型预测确定的;情感标签可以根据待回答语句中词与预设的情感词库中词的匹配度确定是正向还是负向,也可以根据预先构建训练的情感标签预测模型来确定是正向还是负向,还可以给上述两种确定方式预设权重来综合确定情感标签是正向还是负向,比如第一种方式中正向为0.8,负向为0.2,第二种方式正向为0.6,负向为0.4,第一种方式的权重0.5,第二种方式的权重0.5,则综合两种方式后正向为0.7,负向为0.3,那么待回答语句的情感标签就是正向;领域标签是通过长短记忆型递归神经网络模型、卷积神经网络模型和softmax回归模型来确定的,充分利用长短记忆型递归神经网络模型善于获取语序信息的优点和卷积神经网络模型善于特征提取和抽象化的优点。
在预设数据库中,根据至少一个标签确定待回答语句的匹配集合时,可以根据实际运用情况为每种标签预设权重,比如句法标签权重0.3,情感标签权重0.2,领域标签权重0.5,以加权后满足一定条件的相应语句形成匹配集合。
除此之外,在输出答案信息时,可以是文本也可以是语音,可以融合一定的软语,以增加可读性,然后通过语音合成输出,答案信息还可以是食谱、图片等,会根据答案信息类型的不同进行相应的推送。
在上述技术方案中,优选地,预设规则,包括:确定待回答语句与k个语句中的每一语句的词形匹配度;确定待回答语句或k个语句中的每一语句与标准词序的词序匹配度;根据词形匹配度和词序匹配度,确定匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥美的智能科技有限公司,未经合肥美的智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710628166.1/2.html,转载请声明来源钻瓜专利网。