[发明专利]一种变声系统、方法及人机交互系统及方法有效
申请号: | 201210309311.7 | 申请日: | 2012-08-28 |
公开(公告)号: | CN103632672A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 饶丰;陈波;肖斌;熊鹏飞;刘海龙;谢达东;唐宗尧 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L21/043;G06F3/01 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 杨波 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 变声 系统 方法 人机交互 | ||
技术领域
本发明属于互联网技术领域,尤其涉及一种变声系统、方法及人机交互系统及方法。
背景技术
变声系统的应用,主要通过将说话人的声音的基频进行变动,从而生成一种有趣、夸张的声音,例如时下流行的游戏软件talking tom,可以用滑稽的声音完整的复述人的说话。而Avatar(虚拟)技术的应用则是通过人脸五官特征点的跟踪定位,提取人脸表情动作,并通过计算机图形模型建立同步动作,实现人与虚拟形象的交互,有较强的互动性。通过变声系统与Avatar技术相结合可实现听觉与视觉相交互,构成一种新的交互体验。但现有变声系统输出的声音比较单调,即一个用户只能对应一种声音,缺乏个性及趣味性;同时,目前的Avatar技术应用主要是基于PC(personal computer,个人计算机)客户端的,但是,其通常交互性不好,不能完全满足用户交互的需求,另外,相对于PC客户端,由于手机端的浮点精度计算低且运行速度较慢等特征,对算法的实时性有着更高的要求,现有的Avatar技术实现过于简单,交互性差。
发明内容
本发明提供了一种变声系统、方法及人机交互系统及方法,旨在解决现有技术中的变声系统过于单调及交互系统交互性不好的问题。
本发明是这样实现的,一种变声系统,包括:音频输入模块,用于接收第一音频信息;基频变声模块,用于对接收的第一音频信息进行变速变调处理和/或变速不变调处理以获取第二音频信息;音频输出模块,用于输出第二音频信息。
本发明采取的另一技术方案为:一种变声方法,包括:接收输入的第一音频信息;
对接收的第一音频信息进行变速变调处理和/或变速不变调处理以获取第二音频信息;
输出第二音频信息。
本发明采取的又一技术方案为:一种人机交互系统,包括变声系统、人脸检测系统和虚拟形象反馈系统,所述变声系统用于对输入的第一音频信息进行变调处理和/或变速不变调处理,输出第二音频信息;所述人脸检测系统用于定位人脸特征点,并根据人脸特征点定位提取人脸动作信息;所述虚拟形象反馈系统用于根据所述输出的第二音频信息和/或所述提取的人脸动作信息进行人与虚拟形象之间的交互。
本发明采取的另一技术方案为:一种人机交互方法,包括:
对输入的第一音频信息进行变调处理和/或变速不变调处理,输出第二音频信息;
对人脸特征点进行定位,并根据人脸特征点定位提取人脸动作信息;根据输出的第二音频信息和/或所述提取的人脸动作信息进行人与虚拟形象之间的交互。
本发明的技术方案具有如下优点或有益效果:本发明实施例的变声系统、方法通过变声系统的应用,对输入的音频进行变调处理,提高了变声系统的处理能力,改变了现有变声系统过于单调的问题;本发明实施例的人机交互系统及方法通过将视觉、听觉、触觉三种感官有机的结合在一起,形成一种新的交互方式,进一步提高交互性。
附图说明
附图1是本发明实施例的变声系统的结构示意图;
附图2是本发明实施例的变声方法的流程图;
附图3是本发明实施例的变声系统的原始声音频谱图;
附图4是本发明实施例的变声系统声音降速一倍后的频谱效果图;
附图5是本发明实施例的变声系统变调不变速的音频效果图;
附图6是本发明实施例的变声系统声音转换过程示意图;
附图7是本发明实施例的人机交互系统的结构示意图;
附图8是本发明实施例的人机交互系统人眼搜索ROI区域示意图;
附图9是原有人脸特征点标注点与本发明人脸特征点标注点的对比示意图;
附图10是本发明实施例的人机交互方法的流程图;
附图11是本发明另一实施例的人机交互方法的流程图;
附图12是本发明实施例的人机交互方法的人脸特征点形状模型建模流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,是本发明实施例的变声系统的结构示意图。本发明实施例的变声系统包括音频输入模块、基频变声模块和声音转换模块,其中,
音频输入模块用于输入音频;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210309311.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗肾脏囊肿的药物
- 下一篇:一种远动数据的双平面监听装置