[发明专利]检索和生成相结合的对话方法、系统、装置和存储介质在审
申请号: | 201910501324.6 | 申请日: | 2019-06-11 |
公开(公告)号: | CN110362651A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 杨晋吉;莫晓珊;郭一祺;赵淦森;纪堉铤 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/332 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510631 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 初级回复 检索 存储介质 回复信息 匹配结果 评分结果 语料库 预设 对话 信息处理技术 用户输入内容 生成模型 错误率 匹配度 调用 匹配 输出 应用 | ||
本发明公开了一种检索和生成相结合的对话方法,包括以下步骤:将用户输入内容与预设语料库进行检索匹配,得到匹配结果;根据匹配结果调用生成模型得到初级回复信息,或者,根据预设语料库进行处理得到初级回复信息;通过dual LSTM模型对初级回复信息进行评分,得到评分结果;根据评分结果输出最终回复信息。本发明得到的最终回复信息与用户输入的匹配度更高,灵活性高、错误率低。本发明作为一种检索和生成相结合的对话方法、系统、装置和存储介质,可广泛应用于信息处理技术领域。
技术领域
本发明涉及信息处理技术,尤其是一种检索和生成相结合的对话方法、系统、装置和存储介质。
背景技术
随着人类进入信息时代,信息技术的发展,为了调高效率、降低成本和减少人力,市面上逐渐出现了非任务型的开放域对话系统,该系统能自动根据系统本身的设置而无需通过人工操作即能自动且快速对用户输入的内容进行回复。然而,目前大部分的非任务型的开放域对话系统是基于单一的检索模型或单一的生成模型的方法,而基于单一的检索模型的非任务型的开放域对话系统的回复十分依赖原有的语料库,很容易导致检索失败,无法回复语料库不存在的问题;基于单一的生成模型的非任务型的开放域对话系统则很容易产生前后不一致和没有意义的回复,最终导致的结果是并未为用户提供有用的回复,灵活性低、错误率高。
发明内容
有鉴于此,为了解决上述技术问题,本发明的目的是提供具有灵活性高、错误率低的一种检索模型与生成模型相结合以提高回复与用户输入内容匹配度的对话方法、系统、装置和存储介质。
本发明采用的技术方案是:检索和生成相结合的对话方法,包括以下步骤:将用户输入内容与预设语料库进行检索匹配,得到匹配结果;根据匹配结果及预设语料库调用生成模型得到初级回复信息,或者,根据匹配结果及预设语料库处理得到初级回复信息;通过dual LSTM模型对初级回复信息进行评分,得到评分结果;根据评分结果输出最终回复信息。
进一步,所述将用户输入内容与预设语料库进行检索匹配,得到匹配结果的步骤中,包括以下步骤:收集语料资源,对语料资源进行预处理,得到预设语料库;为预设语料库构建倒排索引,得到预设语料库中关键词的倒排记录表;将用户输入内容与所述关键词进行匹配,得到所述匹配结果;其中,预设语料库包括问题和问题对应的回复。
进一步,所述对语料资源进行预处理的步骤中,包括以下步骤:对语料资源进行格式转换,所述格式转换的处理结果的形式包括一问一答的形式;对语料资源进行格式处理、过滤处理、分词处理和向量化处理。
进一步,所述为预设语料库构建倒排索引,得到关键词的倒排记录表的步骤中,包括以下步骤:从预设语料库的问题中获取所述关键词形成词库;根据词库中的所述关键词确定检索词列表;根据检索词列表遍历预设语料库的问题得到所述关键词的倒排记录表。
进一步,所述根据预设语料库进行处理得到初级回复信息步骤中,包括以下步骤:对所述关键词的倒排记录表进行拼接以及去重,获得候选问题集,获得候选问题集;计算候选问题集中的句子与用户输入内容句子的句子相似度,得到计算结果,若计算结果小于或等于设置的第一阈值,调用生成模型生成初级回复信息;若计算结果大于设置的第一阈值,将计算结果中句子相似度最高的候选问题对应的回复作为初级回复信息输出。
进一步,所述根据评分结果输出最终回复信息的步骤中,包括以下步骤:若评分结果大于设置的第二阈值,将初级回复信息直接作为最终回复信息输出;若评分结果小于或等于设置的第二阈值,输出预设的回复信息作为最终回复信息输出。
进一步,根据评分结果输出最终回复信息的步骤中,还包括以下步骤:若评分结果小于或等于设置的第二阈值,返回所述调用生成模型得到初级回复信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910501324.6/2.html,转载请声明来源钻瓜专利网。