[发明专利]一种文字转换动画的方法和装置无效
申请号: | 200810019004.9 | 申请日: | 2008-01-07 |
公开(公告)号: | CN101482975A | 公开(公告)日: | 2009-07-15 |
发明(设计)人: | 李嘉辉 | 申请(专利权)人: | 丰达软件(苏州)有限公司;李嘉辉 |
主分类号: | G06T13/00 | 分类号: | G06T13/00;H04N5/265 |
代理公司: | 南京苏科专利代理有限责任公司 | 代理人: | 陈忠辉 |
地址: | 215021江苏省苏州市工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 转换 动画 方法 装置 | ||
技术领域
本发明涉及一种文字转换动画的方法和装置,且特别涉及一种结合移动通信技术及多媒体技术的文字转换动画的方法和装置。
背景技术
在移动通信技术及多媒体信息技术飞速发展的今天,音频、视频的应用与人们的工作、生活越来越密切,在商业应用中也扮演着越来越重要的角色。
移动通信经历了第一代模拟网络移动通信技术(1G)、第二代数字网络移动通信技术(2G)之后,即将迎来第三代移动通信技术(3G),与以模拟技术为代表的第一代和目前正在使用的第二代移动通信技术相比,第三代移动通信技术(3G)将有更宽的带宽,更高的传输速度。第三代移动通信技术(3G)不仅能传输话音,还能传输数据,从而提供快捷、方便的无线应用。能够实现高速数据传输、宽带多媒体服务及流媒体服务是第三代移动通信技术(3G)的另一个主要特点。第三代移动通信技术(3G)能将高速移动接入和基于互联网协议的服务结合起来,提供实时多媒体及流媒体功能,例如:实时视频电话(视频会议)、视频音频流、远程无线监视、多媒体实时游戏、视频点播等。因此,第三代移动通信技术(3G)的应用有着广阔的开发空间,特别是音频、视频的应用已经成为市场需求的一个新的方向。作为语音合成和视频应用的技术基础,设计一个合理的、高效的文字转换动画的处理模块具有极为重要的研究和实用价值。
专利申请号CN200510034257.X(专利公开号CN1707550)的专利《语音发音与发音口型动画数据库的建立及其访问方法》描述了一种将语音发音与发音口型动画关联的技术方案。其实现方式为:先建立三个数据库,即字典数据库和其相应的声音库、音标发音口形基本图库;然后以相对值或百分比的表示方式,分别将口型图片与音标、音标与单字、单字与句子互相关联建立三个子数据库或包含个子数据库全部内的一个总数据库;访问时,将所要学习的内容文字信息输入,将句子分解为单字;依据字典数据库,找到单字对应的音标和发音;依据依音标发音口形基本图库,从音标找到发音口形基本图;最后计算分配给每张口型图片并与声音同步播放,使声音与发音口型图的同步。
然而,此方法有一定的局限性,首先,该方法必须依赖自用的、特有的字典数据库和其相应的声音库、音标发音口形基本图库,然而这些数据库不会用在普通的移动通信设备上;其次,此方法获得口形的原理是以音标为基础的。
鉴于上述问题,为了提供一个合理的、高效的文字转换动画的处理模块,提供符合汉字的语音系统的文字转换动画的方法,同时使这种方法更具有兼容性,能够普遍应用于移动通信及多媒体信息技术领域,本发明设计了一种文字转换动画的方法和装置。
发明内容
本发明的第一个目的在于提供一种文字转换动画的方法,可以将文字转化为对应的动画,所述方法包括:文字输入步骤;语音合成步骤,将输入的文字进行语音合成以得到对应的音频文件;视频合成步骤,将输入的文字通过视频合成模块合成后,得到与文字对应的视频文件;动画合成步骤,将音频文件与视频文件进行合成得到与文字对应的动画。
根据本发明目的所提供的文字转换动画的方法,其中视频合成步骤更包括:拼音解析步骤和口型合成步骤。拼音解析步骤,将文字进行拼音解析以得到与文字对应的拼音;口型合成步骤,从预设的拼音口型资料库中提取与拼音对应的口型图片,最后将口型图片合成为视频文件。
根据本发明目的所提供的文字转换动画的方法,其中更包括:视频转换模块,将上述视频文件通过视频转换步骤后进行压缩及格式变换,转化成为适合应用的最终视频文件。
根据本发明目的所提供的文字转换动画的方法,其中动画合成步骤更包括口型同步步骤,以使音频文件与视频文件同步并且使总时间保持一致。
根据本发明的目的提供一种文字转换动画的方法,其中拼音解析步骤将所述拼音解析为元音与非元音,口型合成步骤为从预设的口型资料库中分别提取与被解析出来的元音及非元音所对应的口型图片,载入并合成为视频文件。特别地,为了达到降低合成复杂度的目的,非元音对应的口型图片为其中之一元音所对应的口型图片。
根据本发明的目的提供一种文字转换动画的方法,其中拼音解析步骤将所述拼音解析为声母与韵母,口型合成步骤为从预设的口型资料库中分别提取与被解析出来的声母与韵母所对应的口型图片,载入并合成为视频文件。特别地,为了达到降低合成复杂度及提高合成精准度的目的,声母与韵母均可以按照发音方式不同再细分为不同的组,同一组的声母与韵母由于区别很小,可以使用相同的口型图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丰达软件(苏州)有限公司;李嘉辉,未经丰达软件(苏州)有限公司;李嘉辉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810019004.9/2.html,转载请声明来源钻瓜专利网。