[发明专利]一种基于深度学习来实现语音导航机器人的方法有效
| 申请号: | 202011150454.9 | 申请日: | 2020-10-23 | 
| 公开(公告)号: | CN112287673B | 公开(公告)日: | 2021-08-17 | 
| 发明(设计)人: | 黄诗雅;罗睦军;邓从健 | 申请(专利权)人: | 广州云趣信息科技有限公司 | 
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/289;G06N3/04;G10L15/26;B25J11/00 | 
| 代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 乔浩刚 | 
| 地址: | 510630 广东省广州市天河区*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 实现 语音 导航 机器人 方法 | ||
1.一种基于深度学习来实现语音导航机器人的方法,其特征在于,所述方法包括步骤:
S20获取用户通话文本数据;
S30将用户通话文本输入到训练好的基于深度学习的导航队列分类模型进行预测识别,获取输出的导航队列预测结果;
S40根据获取的导航队列预测结果将用户转接到相应的人工队列进行处理;
所述方法还包括:
S10训练基于深度学习的导航队列分类模型,包括如下步骤:
S11获取训练通话录音文本数据组成训练语料,对训练通话录音文本数据进行预处理,获取规范化的训练语料,其中所述训练通话录音文本数据包括通话录音文本和对应的导航队列标签;
S12对规范化的训练语料进行特征工程,获取训练语料的特征向量;
S13将训练语料的特征向量输入到导航队列分类模型进行基于深度学习的模型训练,获取所述训练好的基于深度学习的导航队列分类模型;
其中,所述步骤S11中,对训练通话录音文本数据进行预处理,包括如下步骤:
过滤短语:过滤训练通话录音文本中句子长度低于阈值的句子;
文本分词:加载专用的词库和分词提取工具对训练通话录音文本进行分词处理,输出分词文本;
停用词处理:加载停用词表,并根据所述停用词表过滤分词文本中存在的停用词;
数据均衡处理:统计训练语料中对应每个导航队列标签的各通话录音文本数据量,判断各导航队列是否均衡:如果每个导航队列对应的通话录音文本的数据量保持在平均值的5%内,即不进行处理;否则对训练语料进行向下采样处理,使训练语料中的数据对应各导航队列保持均衡状态;
其中,所述步骤S12中对训练语料进行特征工程,包括如下步骤:
构建语料字典:将分词后的训练语料读入内存,通过计算每个单词在文档中出现的词频,过滤掉词频小于最低阈值或高于最高阈值的单词,然后对剩余、不重复的单词映射成索引表示,构建词汇-索引映射表;
构建队列标签字典:对训练语料的导航队列标签进行去重处理,然后将去重后的导航队列标签映射成索引表,构建标签-索引映射表;
构建词向量:将word2vec词向量模型导入内存中,获取词汇-索引映射表相对应的词向量,作为模型的初始值;
文本序列化:通过词汇-索引映射表把每个文档单词数值化;
队列序列化:通过标签-索引映射表把每个文档标签数值化;
该方法还包括:
将训练语料作为训练样本输入到导航队列分类模型进行训练,得到训练后的导航队列分类模型,包括如下步骤:
将训练语料转化为定长的文本序列;
输入层:在输入层输入定长n的文本序列c,每个词用向量xi表示,每个词嵌入的维度k;将句子表示为表示连接操作,即输入层输入的是文本序列c中各个词汇对应的分布式表示xi,即词向量;其中词向量采用预训练word2vec做输入层的输入,并在模型训练过程中不再微调;
双向RNN层:分为前向RNN和反向RNN;
前向RNN更新状态如下:获取到输入层句子信息假设初始状态将x1输入至函数中,获取状态(2)然后计算获取(3)输入x2后,通过函数来获取(4)依次输入向量xi直到输入xn至函数获取状态其中U[1]、W[1]分别表示权重,b[1]表示偏差;n=1,......,n
反向RNN更新规则如下:获取到输入层句子信息假设初始状态将xn输入到函数中,获取状态依次输入向量xn:1,直到得到即其中U[2]、W[2]分别表示权重,b[2]表示偏差,n=1,......,n;
全连接层:使用一层全连接层将前向RNN与反向RNN进行拼接,其中表示连接操作,其中W是需要学习的权重,b是偏差;
Softmax层:将获取的hn信息输入到softmax激活函数:其中是预测每个导航队列标签的概率情况:采用cost函数评价模型的性能,其中λj是每个导航队列j的权重,表示预测每个导航队列标签的概率与实际对应每个导航队列标签的概率的向量差,其中函数越小说明模型和参数越符合训练样本,通过调节模型参数寻找全局最小的c值,完成模型训练。
2.根据权利要求1所述的一种基于深度学习来实现语音导航机器人的方法,其特征在于,所述导航队列分类模型为基于TEXTRNN实现导航队列分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云趣信息科技有限公司,未经广州云趣信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011150454.9/1.html,转载请声明来源钻瓜专利网。





