[发明专利]一种基于短文本匹配的语音问答方法及系统在审
申请号: | 202210061030.8 | 申请日: | 2022-01-19 |
公开(公告)号: | CN114328881A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 田尊明 | 申请(专利权)人: | 重庆长安汽车股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/216;G06F40/242;G06F40/289 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 万霞 |
地址: | 400020 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 匹配 语音 问答 方法 系统 | ||
本发明公开了一种基于短文本匹配的语音问答方法及系统,该方法包括:将用户语音转换为输入文本;获得纠正文本;对纠正文本进行分词和分词的向量化处理;采用实体词检索、语义相似度和字符相似度联合召回的方式获得知识点候选集;纠正文本和知识点候选集形成配对文本,采用ESIM模型对配对文本是否等价进行预测,基于预测结果对知识点候选集进行排序;基于预测结果进行决策判断,决定回复形式,输出系统的应答文本;将应答文本进行语音播报;设置交互界面的埋点,支持用户对系统返回的应答文本进行有帮助、无帮助的评价反馈;定时抓取用户反馈数据加入ESIM模型进行增量训练。该方法能有效提高汽车专有名词识别准确率,使得未登录词成为词向量可识别词。
技术领域
本发明属于自然语言处理技术领域,特别涉及一种基于短文本匹配的语音问答方法及系统。
背景技术
在汽车驾驶场景,与车机系统通过语音交互的方式,避免了双手和眼睛从驾驶状态转移到车机系统的操控,极大提高了驾驶的安全性。
语音交互系统的实现,主要包括语音转文本,文本语义理解,文本答案生成和文本语音播报四个步骤。在汽车垂直领域的应用,主要存在以下的问题和挑战:(1)语音转文本过程,主要存在专有汽车名词识别准确率较低的问题;(2)文本语义理解过程,需要先将文本向量化,但专有汽车名词容易成为未登录词;(3)文本答案生成,需要在系统中预制问答知识库,从知识库中检索知识点,如直接采用ES检索、关键词检索、字符相似度排序或余弦相似度排序等简单方法,输出答案的准确率较低,如直接将输入文本和系统预制知识库文本配对后,输入ESIM、BERT等文本匹配模型,进行排序,则响应时间过长,影响交互的流畅性。
目前,已有一些改进方法的研究,如中国专利CN202111081901.4公开了一种普法问答系统的向量检索式对话方法,该方法将语音转成的文本,通过bert模型生成句向量,通过向量相似性计算,筛选候选答案,将余弦相似度检索0.9的结果作为答案。该方法仍有许多不足:(1)未考虑语音转换过程中可能出现的错误;(2)余弦相似度作为相似度的最终计算指标,准确度有限。
发明内容
针对现有技术存在的上述不足,本发明的目的就在于提供一种基于短文本匹配的语音问答方法及系统,该方法能有效提高汽车专有名词识别准确率,使得未登录词成为词向量可识别词,并能在保证准确率水平的同时提高效率。
本发明的技术方案是这样实现的:
一种基于短文本匹配的语音问答方法,包括以下步骤:
S1:检测用户语音,并将用户语音转换为输入文本;
S2:对S1得到的输入文本进行错误位点检测和错误纠正,以获得纠正文本;
S3:对S2获得的纠正文本进行分词和分词的向量化处理,以得到分词和句向量;
S4:基于得到的分词和句向量,采用实体词检索、语义相似度和字符相似度联合召回的方式,获得知识点候选集;
S5:基于S2中的纠正文本和知识点候选集形成配对文本,采用ESIM模型对配对文本是否等价进行预测,基于预测结果对知识点候选集进行排序;
S6:基于预测结果进行决策判断,决定回复形式,输出系统的应答文本;
S7:将应答文本进行语音播报;
S8:设置交互界面的埋点,支持用户对系统返回的应答文本进行有帮助、无帮助的评价反馈;
S9:定时抓取S8用户反馈数据并加入ESIM模型,并启动ESIM模型增量训练,评估通过后的ESIM模型,作为最新ESIM模型使用。
进一步地,步骤S2具体包括以下步骤:
S2.1:收集历史对话数据和汽车论坛、汽车百科类开放数据,形成汽车语料集,收集汽车相关的专有实体名词作为汽车专有实体名词词典,采用jieba分词工具,加载汽车专有实体名词词典作为自定义词典,然后对汽车语料集进行分词,训练3-gram以下的kenlm语言模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆长安汽车股份有限公司,未经重庆长安汽车股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210061030.8/2.html,转载请声明来源钻瓜专利网。