[发明专利]一种基于自构建多场景的对话追踪方法在审
| 申请号: | 202111150461.3 | 申请日: | 2021-09-29 |
| 公开(公告)号: | CN114003773A | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 李青;胡萌;李立力 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9032;G06F40/211;G06F40/284;G06F40/35;B25J11/00 |
| 代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 李越 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 构建 场景 对话 追踪 方法 | ||
本发明公开了一种基于自构建多场景的对话追踪方法,该系统首先对用户输入的问句进行特征工程处理,然后将处理过的问句送入多层级的线性过滤器中,使其先后通过模板匹配、图谱检索、问题检索、模型预测、联网搜索等多个模块,最终得到答案返回给用户。多个模块负责不同类型的问答,最后如果都无法匹配答案则调用外部接口进行联网搜索,这种结构设计能够充分利用各个模块的技术优势,从而有效提高了最后输出的回答的可靠性,减少了聊天机器人常见的安全回答现象,同时也保证了程序能够应用于多数聊天场景之中,提高了泛用性。
技术领域
本发明涉及机器人技术领域,尤其涉及一种基于自构建多场景的对话追踪方法。
背景技术
聊天机器人也可被称作自动问答系统,其是指利用计算机自动回答用户所提出的问题以满足用户知识需求任务的系统,主要应用于客户服务等领域。与现有搜索引擎不同,自动问答系统不再是基于简单的关键词匹配排序得到一个网页集合,而是能够精准的生成自然语言答案返回给用户。聊天机器人的存在让用户无需逐个浏览和仔细阅读搜索引擎返回的每个链接网址中的信息,再剔除冗余信息后才能得到期望的答案,这为用户节约了大量的时间。近年来,随着人工智能的飞速发展,自动问答系统作为自然语言处理的一个重要分支,已经成为倍受关注且发展前景广泛的研究方向。
目前,市面上现有的中文聊天机器人主要分为以下三种类型:
1.基于人工模板的聊天机器人。该方法是根据用户输入的句子,在模板库中找到匹配的问句模板,然后按照对应的应答模板生成答案,返回给用户。这种方法的优点是精确,缺点是需要大量的人力,并且缺乏灵活性,可扩展性差。
2.基于检索的聊天机器人。基于检索技术的聊天机器人根据用户输入的句子,在对话库中以搜索匹配的方式进行匹配,从中找到最合适的应答内容,将答案提取出来返回给用户。这种方法对对话库的要求很高,并且需要足够大,但是它的优点是回答质量高,表达比较自然。
3.基于深度学习的聊天机器人。基于深度学习的聊天机器人根据用户输入的句子,利用模型逐词或逐字生成答案,然后将答案回复给用户。其中多数技术采用了Encoder-Decoder模型,即编码-解码模型。这种方法思路简单,可扩展,能够更好地理解上下文,但是模型很难训练,回复时经常存在一些语法错误。
上文中提到的三种类型的聊天机器人都有其各自的优缺点,但是目前的聊天机器人通常都只使用单一的技术思路去实现,这造成了最终产品的泛用性较低,无法适用于多种聊天场景,对于一些特定的使用场景甚至需要特别定制,这也使得成本大幅攀升。
发明内容
本发明的目的就在于为了解决上述问题而提供一种基于自构建多场景的对话追踪方法。
本发明通过以下技术方案来实现上述目的:
本发明包括以下步骤:
S1:首先对用户输入的问句进行特征工程处理以满足后续模块处理的需要;
S2:将经过处理的问句送入多层级问答处理模块;
S3:进入图谱检索模块;
S4:在问题检索模块会利用倒排索引,根据问题的余弦相似度在问答库中查询相似问题从而筛选出答案;
S5:在模型预测模块启动时,需要加载已经预训练过的seq2seq模型;
S6:最后一个模块为联网搜索模块,当问题送入联网搜索模块即意味着本地语料库没有匹配到答案,因此将会调用搜狗问问提供的接口获取相似问题的链接,再通过从搜索结果页面中收集答案,并输出给用户。
本发明的有益效果在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111150461.3/2.html,转载请声明来源钻瓜专利网。





