[发明专利]实现从文本到语音TTS的音频转码方法、装置及系统有效
申请号: | 201110169703.3 | 申请日: | 2011-06-22 |
公开(公告)号: | CN102231734B | 公开(公告)日: | 2017-10-03 |
发明(设计)人: | 张闽;张伟;刘澍 | 申请(专利权)人: | 南京中兴新软件有限责任公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 余刚,梁丽超 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 文本 语音 tts 音频 方法 装置 系统 | ||
技术领域
本发明涉及通信领域,具体而言,尤其涉及一种实现从文本到语音TTS的音频转码方法、装置及系统。
背景技术
媒体服务器用于所有与音视频相关的媒体处理,包括视频和音频RTP数据流到视音频文件的相互转换。同时,也负责接收用户通过终端的DTMF输入、播放业务的引导语音、显示动态的引导画面。它具有的SIP协议和MSML/MOML能力使得其能在应用服务器APP的控制下完成整个会话过程的与用户的交互。
媒体控制单元(MSCU)是媒体服务器中的一个重要单元,主要完成与其他实体进行能力协商,提供资源本身的管理、维护以及控制其它业务资源单元完成复杂业务的功能。
媒体存储传输音频单元(MSTU-audio)是媒体服务器中的业务资源单元,完成海量的音频数据存储,包括实现音频文件播放功能。媒体存储单元上有对外网口,可以直接通过单元上的对外网口收发。
媒体存储传输视频单元(MSTU-video)是媒体服务器中的业务资源单元,完成海量的多媒体音视频数据存储,包括实现视频文件播放功能。媒体存储单元上有对外网口,可以直接通过单元上的对外网口收发。
现在,媒体服务器播的使用很广。主要可以归纳为音视频播放,收号和会议等功能。
从文本到语音(Text To Speech,简称为TTS)的功能是将输入的文本信息识别出来,转化为语音信息,将语音媒体发送给用户。目前在电信领域,TTS的应用基本是配置一个专门的TTS服务器,通过信令指定TTS将语音发送到用户端来完成一次业务。
图1是根据相关技术的实现TTS音频转码的系统结构示意图。如图1所示,该系统的工作流程包括如下步骤:
步骤101:终端发起一次呼叫,激活APP的业务。APP向媒体服务器发起业务流程;
步骤102:APP通过SIP信令向媒体服务器请求TTS业务;
步骤103:媒体服务器通过SIP信令向TTS服务器请求TTS资源,并通过MRCP协议控制TTS服务器完成业务功能;
步骤104:TTS服务器向终端发送媒体
以上便是目前典型的组网和业务流程。TTS服务器作为媒体服务器的外置设备使用。APP在请求业务的时候只是向媒体服务器发起,媒体服务器判断业务类型,当业务类型为TTS应用时,媒体服务器再向TTS服务器发起请求,申请资源,并控制TTS服务器的行为,TTS服务器在收到信令后自动将媒体发送给远方的终端。
以上流程能完成一个基本的TTS业务。不过随着业务的应用的扩展出现了一些问题。比如,TTS服务器的音频能力集同媒体服务器能力集不匹配的问题,造成业务失败。因为APP在同媒体服务器协议SDP的时候,媒体服务器并不知道业务类型是否是TTS,所以会按照自己的能力范围同终端协商音频参数。当APP向媒体服务器下发INFO指令时,媒体服务器才能识别出TTS业务类型,此时媒体服务器通过终端SDP信息向TTS服务器申请资源。如果TTS服务器的音频能力范围不满足媒体服务器同终端协商出的结果,就是造成业务失败。比如:媒体服务器同终端协商出编解码类型为G726格式,但是TTS服务器只支持G711的音频格式。。
针对上述现有技术中在TTS服务器的音频能力集无法满足媒体服务器的业务需求的情况下,终端访问媒体业务数据包数据失败的问题,目前还没有有效的解决方案。
发明内容
本发明的主要目的在于提供一种实现从文本到语音TTS的音频转码方法、装置及系统,以解决现有技术中在TTS服务器的音频能力集无法满足媒体服务器的业务需求的情况下,终端访问媒体业务数据包数据失败的问题。
为了实现上述目的,根据本发明的一方面,提供了一种实现从文本到语音TTS的音频转码方法。
根据本发明的实现TTS音频转码的方法包括:媒体服务器接收来自应用服务器APP的访问请求,并确定媒体服务器支持的编解码类型集;媒体服务器接收APP申请的TTS业务请求,并根据TTS业务类型向TTS服务器申请满足该业务类型的媒体业务数据包;媒体服务器根据编解码类型集与TTS服务器进行协商,以获取协商后的音频编解码类型,并按照音频编解码类型将媒体业务数据包转码后发送至终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中兴新软件有限责任公司,未经南京中兴新软件有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110169703.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示系统和显示方法
- 下一篇:基于信息网络的数值评估方法及系统