[发明专利]一种基于深度学习来实现语音导航机器人的方法有效
| 申请号: | 202011150454.9 | 申请日: | 2020-10-23 | 
| 公开(公告)号: | CN112287673B | 公开(公告)日: | 2021-08-17 | 
| 发明(设计)人: | 黄诗雅;罗睦军;邓从健 | 申请(专利权)人: | 广州云趣信息科技有限公司 | 
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/289;G06N3/04;G10L15/26;B25J11/00 | 
| 代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 乔浩刚 | 
| 地址: | 510630 广东省广州市天河区*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 实现 语音 导航 机器人 方法 | ||
本发明提供一种基于深度学习来实现语音导航机器人的方法,方法包括步骤:获取用户通话文本数据;将用户通话文本输入到训练好的基于深度学习的导航队列分类模型进行预测识别,获取输出的导航队列预测结果;根据获取的导航队列预测结果将用户转接到相应的人工队列进行处理。本发明提供的方法能够对大量文本数据针对性进行训练,可以快速获取良好的效果。后期遇到新知识时,可以加强训练使其模型适应文本数据中存在的新知识,从而可以大幅度改善人力成本和提高时间成本。
技术领域
本发明涉及电信通讯领域、深度学习领域、自然语言领域,特别是涉及一种基于深度学习对运营商文本实现导航机器人的方法。
背景技术
目前语音导航机器人使用语音交互方式来识别用户意图,然后机器人自动判断用户情况后对接相关人工队列进行处理。这个过程中需要机器人自动去识别用户话语信息然后转接相关队列的过程。利用传统规则方式可以得到较好的结果,但是背后需要大量人工去标注关键词,并且后期维护关键词词库。但是由于每天有2、3万用户使用语音导航机器人情况下,非结构化文本内容变得复杂化,这需要大量人工逐条标注并建立关键词词库的话,这将会需要耗费大量的人力资源,还需要大量的时间成本。
发明内容
针对语音导航机器人中产生的文本如果使用大量人力去标注来搭建关键词库,然后利用关键词库进行快速索引的方式可以匹配到正确导航队列中。但是会消耗大量人力和时间的技术问题,本发明旨在提供一种高效率、自动化,准确性高的基于深度学习来实现语音导航机器人的方法。
本发明的目的采用以下技术方案来实现:
本发明示出一种基于深度学习来实现语音导航机器人的方法,方法包括步骤:
S20获取用户通话文本数据;
S30将用户通话文本输入到训练好的基于深度学习的导航队列分类模型进行预测识别,获取输出的导航队列预测结果;
S40根据获取的导航队列预测结果将用户转接到相应的人工队列进行处理。
一种实施方式中,该方法还包括:
S10训练基于深度学习的导航队列分类模型,包括如下步骤:
S11获取训练通话录音文本数据组成训练语料,对训练通话录音文本数据进行预处理,获取规范化的训练语料,其中训练通话录音文本数据包括通话录音文本和对应的导航队列标签;
S12对规范化的训练语料进行特征工程,获取训练语料的特征向量;
S13将训练语料的特征向量输入到导航队列分类模型进行基于深度学习的模型训练,获取训练好的基于深度学习的导航队列分类模型。
一种实施方式中,步骤S11中,对训练通话录音文本数据进行预处理,包括如下步骤:
过滤短语:过滤训练通话录音文本中句子长度低于阈值的句子;
文本分词:加载专用的词库和分词提取工具对训练通话录音文本进行分词处理,输出分词文本;
停用词处理:加载停用词表,并根据停用词表过滤分词文本中存在的停用词;
数据均衡处理:统计训练语料中对应每个导航队列标签的各通话录音文本数据量,判断各导航队列是否均衡:如果每个导航队列对应的通话录音文本的数据量保持在平均值的5%内,即不进行处理;否则则对训练语料进行向下采样处理,使训练语料中的数据对应各导航队列保持均衡状态。
一种实施方式中,步骤S12中对训练语料进行特征工程,包括如下步骤:
构建语料字典:将分词后的训练语料读入内存,通过计算每个单词在文档中出现的词频,过滤掉词频小于最低阈值或高于最高阈值的单词,然后对剩余、不重复的单词映射成索引表示,构建词汇-索引映射表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云趣信息科技有限公司,未经广州云趣信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011150454.9/2.html,转载请声明来源钻瓜专利网。





