[发明专利]电话语音的处理方法在审
申请号: | 202110350562.9 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113096645A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 徐戈;杨晓燕;张华;林涌超;关胤;林东亮 | 申请(专利权)人: | 闽江学院 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/26;G10L25/78;G06F16/332;H04M3/527 |
代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 黄以琳;张忠波 |
地址: | 350108 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电话 语音 处理 方法 | ||
一种电话语音的处理方法,包括如下步骤,获取用户语音,并进行VAD检测,检测用户说话的语音起始点和静音停顿点,根据语音起始点和静音停顿点切分出音频段落,将音频段落送入语音识别服务进程,由语音识别进程将音频段落转换为文本;将语音识别进程转换的文本送入智能对话系统流程,并获得文本形式的对话返回结果;将文本形式的对话返回结果送入语音合成进程,将合成后的语音数据发送至电话网关,从而发送至用户电话端。通过上述方案我们实现了一种电话语音的会话处理方法,能够通过处理输入的语音音频,并进行分析,并通过处理结果进行响应,从而提升用户的使用体验。
技术领域
本发明涉及人机交互领域,尤其涉及一种电话语音的处理方法。
背景技术
自动化客服已经深入了各行各业,能够进行简单的问题检索和显示,但仍然不够智能,为了能够进行相关的人工智能对话的更加智能化,需要提出一种新的电话语音的会话处理的方法。
发明内容
为此,需要提供一种进行相关的人工智能对话的电话语音的处理方法,以解决在现有技术中人机交互过程中用户体验不佳的问题;
为实现上述目的,发明人提供了一种电话语音的处理方法,包括如下步骤,
获取用户语音,并进行VAD检测,检测用户说话的语音起始点和静音停顿点,根据语音起始点和静音停顿点切分出音频段落,将音频段落送入语音识别服务进程,由语音识别进程将音频段落转换为文本;
将语音识别进程转换的文本送入智能对话系统流程,并获得文本形式的对话返回结果;
将文本形式的对话返回结果送入语音合成进程,将合成后的语音数据发送至电话网关,从而发送至用户电话端;但在此过程中,始终检测用户语音起始点,若语音处理服务器检测到用户说话的语音起始点,则停止发送所述合成后的语音数据。
具体地,还包括步骤,设置语音处理服务器,将语音识别服务器的地址标识发送至sip服务器登记保存;
电话网关获取用户电话接入信号;
电话网关向sip服务器发送INVITE请求,并在sip服务器发送响应后停止发送INVITE请求;
sip服务器根据预设的语音处理服务器地址,转发INVITE请求至语音处理服务器;
语音处理服务器发送接听响应,由sip服务器转发至电话网关,建立语音通道。
具体地,在语音处理服务器发送接听响应,由sip服务器转发至电话网关,建立语音通道之后,语音处理服务器立即发送欢迎词音频数据,通过建立的语音通道发送至电话网关,从而发送至用户电话端。
进一步地,在语音处理服务器检测到用户说话的语音起始点时,先持续监测用户说话的语音静音停顿点,如果在时间Tstop内未检测到语音静音停顿点,才执行进行步骤:停止发送所述合成后的语音数据。
优选地,在语音处理服务器执行停止发送操作后,立即发送响应音频数据,通过建立的语音通道发送至电话网关。
进一步地,包括多个语音识别服务进程,语音处理服务器切分出语音起始点和静音停顿点部分的音频后,轮流送入不同的语音识别服务进程。
具体地,智能对话系统流程具体包括步骤:对所述文本输入执行意图理解,根据意图理解的结果选择将文本输入送入开域对话及问答流程、任务式对话流程;
其中,开域对话及问答流程如下,
对文本输入计算第一句子向量;
根据第一句子向量与答案库中的问题的句子向量比对结果,找出与第一句子向量相似度最高的答案库中的问题;
返回该问题的答案;
任务式对话流程的步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110350562.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频制作方法及装置
- 下一篇:柜式储能系统的温度控制方法、装置及设备