[发明专利]一种变声系统、方法及人机交互系统及方法有效
申请号: | 201210309311.7 | 申请日: | 2012-08-28 |
公开(公告)号: | CN103632672A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 饶丰;陈波;肖斌;熊鹏飞;刘海龙;谢达东;唐宗尧 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L21/043;G06F3/01 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 杨波 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 变声 系统 方法 人机交互 | ||
1.一种变声系统,其特征在于,包括:音频输入模块,用于接收第一音频信息;基频变声模块,用于对接收的第一音频信息进行变速变调处理和/或变速不变调处理以获取第二音频信息;音频输出模块,用于输出第二音频信息。
2.根据权利要求1所述的变声系统,其特征在于,所述基频变声模块对输入音频进行变速变调的处理方式为:采用傅立叶频域变换,对音频声音在频谱上进行拉伸。
3.根据权利要求1或2所述的变声系统,其特征在于,所述基频变声模块对输入音频进行变速不变调处理方式为:在保证音频原始特征不变的前提下,调整音频信号的时间长度,所述音频原始特征包括:音频的频率、振幅和相位。
4.根据权利要求1或2所述的变声系统,其特征在于,所述变声系统还包括声音转换模块,所述声音转换模块用于建立说话人声音和目标转换人声音的模型来实现声音的转换。
5.一种变声方法,包括:
接收输入的第一音频信息;
对接收的第一音频信息进行变速变调处理和/或变速不变调处理以获取第二音频信息;
输出第二音频信息。
6.根据权利要求5所述的变声方法,其特征在于,对输入音频进行变速变调的处理方式为:采用傅立叶频域变换,对音频声音在频谱上进行拉伸;对输入音频进行变速不变调处理方式为:在保证音频原始特征不变的前提下,调整音频信号的时间长度,所述音频原始特征包括:音频的频率、振幅和相位。
7.根据权利要求5所述的变声方法,其特征在于,所述变声方法还包括:建立说话人声音和目标转换人声音的模型实现声音的转换。
8.一种人机交互系统,其特征在于,包括变声系统、人脸检测系统和虚拟形象反馈系统,所述变声系统用于对输入的第一音频信息进行变调处理和/或变速不变调处理,输出第二音频信息;所述人脸检测系统用于定位人脸特征点,并根据人脸特征点定位提取人脸动作信息;所述虚拟形象反馈系统用于根据所述输出的第二音频信息和/或所述提取的人脸动作信息进行人与虚拟形象之间的交互。
9.根据权利要求8所述的人机交互系统,其特征在于,所述变声系统还包括基频变声模块和声音转换模块,所述基频变声模块用于将音频进行变调不变速处理,所述声音转换模块用于建立说话人声音和目标转换人声音模型实现声音转换。
10.根据权利要求8或9所述的人机交互系统,其特征在于,所述人脸检测系统包括人脸检测模块、特征点拟合模块、特征点定位模块和动作提取模块,所述人脸检测模块用于结合人脸检测和人眼匹配对人脸位置进行初步定位;所述特征点拟合模块用于根据初步定位信息结合表观模型的至少一特征进行人脸特征点拟合;所述特征点定位模块用于根据特征点拟合结果完成人脸特征点定位,并根据人脸特征点获取人眼图像,通过人眼检测单元以上一帧图像中的人眼图像作为模板在人眼感兴趣区域内匹配下一帧图像中双眼的位置;所述动作提取模块用于根据人脸特征点定位提取人脸的动作信息。
11.根据权利要求10所述的人机交互系统,其特征在于,所述人脸检测模块还包括人眼检测单元和人脸检测单元,所述人眼检测单元用于判断上一帧图像是否检测出人眼,如果是,在人眼感兴趣区域内进行搜索,匹配人眼的位置信息;如果否,则通过人脸检测单元进行人脸检测;所述人脸检测单元用于进行人脸检测,并判断是否检测出人脸,如果是,获得人脸的初始位置信息和初始人脸大小信息;如果否,则重新输入视频。
12.根据权利要求10所述的人机交互系统,其特征在于,所述特征点拟合模块还包括人眼拟合单元、人脸拟合单元和拟合判断单元,
所述人眼拟合单元用于根据人脸的初始位置信息进行人脸特征点拟合,并通过拟合判断单元判断人脸特征点是否拟合成功;
所述人脸拟合单元用于根据人脸的初始位置和大小信息结合表观模型灰度值、人脸的初始位置x,y轴方向的梯度值、边缘和角点特征进行人脸特征点拟合,并通过拟合判断单元判断人脸特征点是否拟合成功;
所述拟合判断单元用于判断人脸特征点是否拟合成功,如果是,通过特征点定位模块定位人脸特征点,如果否,则重新输入视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210309311.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗肾脏囊肿的药物
- 下一篇:一种远动数据的双平面监听装置