[发明专利]电话语音的处理系统在审
申请号: | 202110348566.3 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113096644A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 林东亮;章亮;杨晓燕;林涌超;关胤;徐戈 | 申请(专利权)人: | 闽江学院 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/26;G10L13/02;G06F16/332;H04M3/527 |
代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 黄以琳;张忠波 |
地址: | 350108 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电话 语音 处理 系统 | ||
1.一种电话语音的处理系统,其特征在于,包括语音处理服务器、用户端,
所述语音处理服务器包括音频检测单元、音频切分单元、语音识别进程、语音合成进程,所述音频检测单元用于获取用户音频,并进行VAD检测,检测用户音频的语音起始点和静音停顿点,所述音频切分单元用于根据语音起始点和静音停顿点切分出音频段落,并将音频段落送入语音识别进程,所述语音识别进程用于将音频段落转换为文本;
所述语音识别进程用于转换的文本送入智能对话流程,并获得文本形式的对话返回结果;
所述语音合成进程用于将文本形式的对话返回结果合成语音数据,并将合成后的语音数据发送至电话网关,从而发送至用户端;用户端对合成后的语音数据进行播送,同时所述音频检测单元始终检测用户语音起始点,若检测到用户说话的语音起始点,则停止发送所述合成后的语音数据。
2.根据权利要求1所述的电话语音的处理系统,其特征在于,还包括sip服务器,sip服务器用于登记保存语音识别服务器的地址标识;
电话网关获取用户电话接入信号;
电话网关向sip服务器发送INVITE请求,并在sip服务器发送响应后停止发送INVITE请求;
sip服务器根据预设的语音处理服务器地址,转发INVITE请求至语音处理服务器;
语音处理服务器发送接听响应,由sip服务器转发至电话网关,建立语音通道。
3.根据权利要求2所述的电话语音的处理系统,其特征在于,在语音处理服务器发送接听响应,由sip服务器转发至电话网关,建立语音通道之后,语音处理服务器立即发送欢迎词音频数据,通过建立的语音通道发送至电话网关,从而发送至用户电话端。
4.根据权利要求1所述的电话语音的处理系统,其特征在于,所述音频检测单元检测到用户说话的语音起始点时,先持续监测用户说话的语音静音停顿点,如果在时间Tstop内未检测到语音静音停顿点,语音合成进程才停止发送所述合成后的语音数据。
5.根据权利要求1所述的电话语音的处理系统,其特征在于,语音合成进程执行停止发送操作后,立即发送响应音频数据,通过建立的语音通道发送至电话网关。
6.根据权利要求1所述的电话语音的处理系统,其特征在于,语音处理服务器关联多个语音识别服务进程,所述音频切分单元切分出语音起始点和静音停顿点部分的音频后,轮流送入不同的语音识别服务进程。
7.根据权利要求1所述的电话语音的处理系统,其特征在于,包括存储介质,所述存储介质存储有计算机程序,所述计算机程序在被运行时执行的智能对话流程具体包括步骤:对所述文本输入执行意图理解,根据意图理解的结果选择将文本输入送入开域对话及问答流程、任务式对话流程;
其中,开域对话及问答流程如下,
对文本输入计算第一句子向量;
根据第一句子向量与答案库中的问题的句子向量比对结果,找出与第一句子向量相似度最高的答案库中的问题;
返回该问题的答案;
任务式对话流程的步骤如下:
对文本输入计算第二句子向量;
根据第二句子向量与任务式对话库中任务代表句子的句子向量比对结果,找出相似度最高的任务代表句子,获取任务代表句子对应的任务;
获取任务代表句子对应的任务所要获取的信息;
检测所述文本输入中是否包含所述要获取的信息;
如果没有,则提示用户补充信息,直至所有要获取的信息均被检测到,
构建标注语料库,并用该语料库训练一个开域对话模型,在进入开域对话流程时直接使用该开域对话模型返回结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110348566.3/1.html,转载请声明来源钻瓜专利网。