[发明专利]一种通话即时原声语音翻译的通话终端及方法在审
申请号: | 201710612906.2 | 申请日: | 2017-07-25 |
公开(公告)号: | CN107465816A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 闭东阳 | 申请(专利权)人: | 广西一定能电子科技有限公司 |
主分类号: | H04M1/725 | 分类号: | H04M1/725;G06F17/28 |
代理公司: | 广西南宁明智专利商标代理有限责任公司45106 | 代理人: | 农劲风 |
地址: | 530031 广西壮族自治区南宁*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通话 即时 原声 语音 翻译 终端 方法 | ||
1.一种通话即时原声语音翻译的通话终端,其特征是:所述通话终端内部系统包括通信单元、存储单元、翻译单元、模拟语音处理单元和主控单元,其中通信单元、存储单元、翻译单元、模拟语音处理单元均与主控单元相连接并受其控制;
所述通信单元除了用于执行通用移动电话通信标准,实现常规语音通话和语音拾取录制功能之外,还用于接入互联网,实现快速传输音频和文本数据信息;
所述存储单元用于存储用户翻译设置、原声音频文件、语音转换文本、翻译文本、翻译文本机器语音音频文件、原声音频特性曲线、翻译文本原声语音音频文件;
所述翻译单元包括第一翻译通道和第二翻译通道,其中第一翻译通道用于将主叫方语音的识别文本翻译成被叫方语言文本,第二翻译通道用于将被叫方语音的识别文本翻译成主叫方语言文本,所述翻译单元通过通信单元与互联网第三方翻译服务器API接口相连接,并借助互联网所提供的第三方翻译服务进行翻译;
所述模拟语音处理单元包括模拟学习模块、语音转换模块和音频分析模块;语音转换模块用于将原声音频文件识别转换成文本和将翻译文本转换成机器发音的翻译音频;音频分析模块用于分析提取通话双方原声音频中的音调、响度、音律、音色以及共振峰频率(极点频率)的分布特性,并拟合成原声音频特性曲线;模拟学习模块用于将语音转换模块生成的机器发音的翻译音频与音频分析模块生成的原声音频特性曲线进行叠加,得到模拟原声语音特点的翻译音频;
所述主控单元用于设定通话终端进行原声语音翻译工作的执行流程,控制通话终端内各单元协调配合工作。
2.一种基于权利要求1所述的通话终端的通话即时原声语音翻译的方法,其特征是包括以下步骤:
(1)使用通话终端进行通话前,先根据通话双方的说话语言对通话终端设置两种翻译语言,且设置信息存入通话终端的存储单元中,并与相应的联系人信息进行绑定;
(2)电话接通后,在通话过程中,通话终端的通信单元分别拾取通话双方每句话的语音作为主叫方和被叫方原声音频文件,并存入存储单元中;
(3)模拟语音处理单元中的语音转换模块把主叫方和被叫方原声音频文件调出,采用语音识别技术,将主叫方原声音频文件识别成主叫方语言文字,得到第一语言文本,同时将被叫方原声音频文件识别成被叫方语言文字,得到第二语言文本;
(4)通话终端的通信单元利用高速网络通信技术快速接入互联网第三方翻译服务器API接口,翻译单元借助互联网提供的第三方翻译服务,由第一翻译通道将第一语言文本翻译成被叫方语言的第一目标语言文本,第二翻译通道将第二语言文本翻译成主叫方语言的第二目标语言文本;
(5)模拟语音处理单元中的语音转换模块采用文本朗读技术,将第一目标语言文本按被叫方语言的读音转换成机器语音发音的第一目标语言语音,同时将第二目标语言文本按主叫方语言的读音转换成机器语音发音的第二目标语言语音,然后将第一目标语言语音和第二目标语言语音存入存储单元中;
(6)模拟语音处理单元中的音频分析模块调用存储单元中的主叫方和被叫方原声音频文件,分别对主叫方和被叫方原声音频文件的音频特性参数进行分析,通过软件傅立叶变换计算和信号采样,得到主叫方和被叫方原声音频中的音调、响度、音律、音色以及共振峰频率的分布特性,并分别拟合成主叫方原声音频特性曲线和被叫方原声音频特性曲线,再存入存储单元中;
(7)模拟语音处理单元中的模拟学习模块采用基于PSOLA算法的时域波形拼接技术,将存储单元中的第一目标语言语音与主叫方原声音频特性曲线进行波形叠加,用主叫方原声音频特性曲线对机器语音发音的第一目标语言语音进行修饰,得到模拟主叫方原声语音特点的第一目标语言语音,即第一合成语音;基于同样的手段,模拟学习模块还同时将存储单元中的第二目标语言语音与被叫方原声音频特性曲线进行波形叠加,用被叫方原声音频特性曲线对机器语音发音的第二目标语言语音进行修饰,得到模拟被叫方原声语音特点的第二目标语言语音,即第二合成语音;
(8)通信单元将主叫方每句话的第一合成语音即时发送至被叫方接听,并将被叫方每句话的第二合成语音即时发送至主叫方接听,由此实现通话双方即时原声语音翻译的效果。
3.根据权利要求2所述的通话即时原声语音翻译的方法,其特征是:在所述步骤(1)中,对通话终端设置翻译语言时采用人工设置。
4.根据权利要求2所述的通话即时原声语音翻译的方法,其特征是:在所述步骤(1)中,由通话终端根据通话双方电话号码归属地自动设置当地语言作为翻译语言。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西一定能电子科技有限公司,未经广西一定能电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710612906.2/1.html,转载请声明来源钻瓜专利网。