[发明专利]电话语音的处理方法在审
| 申请号: | 202110350562.9 | 申请日: | 2021-03-31 | 
| 公开(公告)号: | CN113096645A | 公开(公告)日: | 2021-07-09 | 
| 发明(设计)人: | 徐戈;杨晓燕;张华;林涌超;关胤;林东亮 | 申请(专利权)人: | 闽江学院 | 
| 主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/26;G10L25/78;G06F16/332;H04M3/527 | 
| 代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 黄以琳;张忠波 | 
| 地址: | 350108 福建省*** | 国省代码: | 福建;35 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 电话 语音 处理 方法 | ||
1.一种电话语音的处理方法,其特征在于,包括如下步骤,
获取用户音频,并进行VAD检测,检测用户音频的语音起始点和静音停顿点,根据语音起始点和静音停顿点切分出音频段落,将音频段落送入语音识别服务进程,由语音识别进程将音频段落转换为文本;
将语音识别进程转换的文本送入智能对话流程,并获得文本形式的对话返回结果;
将文本形式的对话返回结果送入语音合成进程,将合成后的语音数据发送至电话网关,从而发送至用户端;用户端对合成后的语音数据进行播送,同时始终检测用户语音起始点,若检测到用户说话的语音起始点,则停止发送所述合成后的语音数据。
2.根据权利要求1所述的电话语音的处理方法,其特征在于,还包括步骤,设置语音处理服务器,将语音识别服务器的地址标识发送至sip服务器登记保存;
电话网关获取用户电话接入信号;
电话网关向sip服务器发送INVITE请求,并在sip服务器发送响应后停止发送INVITE请求;
sip服务器根据预设的语音处理服务器地址,转发INVITE请求至语音处理服务器;
语音处理服务器发送接听响应,由sip服务器转发至电话网关,建立语音通道。
3.根据权利要求2所述的电话语音的处理方法,其特征在于,在语音处理服务器发送接听响应,由sip服务器转发至电话网关,建立语音通道之后,语音处理服务器立即发送欢迎词音频数据,通过建立的语音通道发送至电话网关,从而发送至用户电话端。
4.根据权利要求1所述的电话语音的处理方法,其特征在于,在语音处理服务器检测到用户说话的语音起始点时,先持续监测用户说话的语音静音停顿点,如果在时间Tstop内未检测到语音静音停顿点,才执行进行步骤:停止发送所述合成后的语音数据。
5.根据权利要求1所述的电话语音的处理方法,其特征在于,在语音处理服务器执行停止发送操作后,立即发送响应音频数据,通过建立的语音通道发送至电话网关。
6.根据权利要求1所述的电话语音的处理方法,其特征在于,存在多个语音识别服务进程,语音处理服务器切分出语音起始点和静音停顿点部分的音频后,轮流送入不同的语音识别服务进程。
7.根据权利要求1所述的电话语音的处理方法,其特征在于,智能对话系统流程具体包括步骤:对所述文本输入执行意图理解,根据意图理解的结果选择将文本输入送入开域对话及问答流程、任务式对话流程;
其中,开域对话及问答流程如下,
对文本输入计算第一句子向量;
根据第一句子向量与答案库中的问题的句子向量比对结果,找出与第一句子向量相似度最高的答案库中的问题;
返回该问题的答案;
任务式对话流程的步骤如下:
对文本输入计算第二句子向量;
根据第二句子向量与任务式对话库中任务代表句子的句子向量比对结果,找出相似度最高的任务代表句子,获取任务代表句子对应的任务;
获取任务代表句子对应的任务所要获取的信息;
检测所述文本输入中是否包含所述要获取的信息;
如果没有,则提示用户补充信息,直至所有要获取的信息均被检测到;
构建标注语料库,并用该语料库训练一个开域对话模型,在进入开域对话流程时直接使用该开域对话模型返回结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110350562.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频制作方法及装置
 - 下一篇:柜式储能系统的温度控制方法、装置及设备
 





