[发明专利]一种实时语音驱动虚拟人物动作的方法和系统在审
| 申请号: | 202010836241.5 | 申请日: | 2020-08-19 |
| 公开(公告)号: | CN111939558A | 公开(公告)日: | 2020-11-17 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京中科深智科技有限公司 |
| 主分类号: | A63F13/215 | 分类号: | A63F13/215;A63F13/424;A63F13/825;G06N3/08;G06T13/40;G10L15/16;G10L15/26 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100000 北京市丰台区航*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实时 语音 驱动 虚拟 人物 动作 方法 系统 | ||
本发明公开了一种实时语音驱动虚拟人物动作的方法和系统,其中方法包括:利用Unity引擎(但并不局限于Unity游戏引擎,所有实时游戏引擎都支持,例如Unreal游戏引擎等。)建立虚拟人物动作场景;为虚拟人物执行不同动作添加相对应的变量条件;将语音接口集成到Unity引擎中;获取语音数据;将获取到的语音数据通过语音接口上传给一语音识别系统,语音识别系统对语音数据进行内容识别后输出语音识别结果;Unity引擎通过语音接口接收语音识别结果,并根据语音识别结果匹配虚拟人物动作变量条件;Unity引擎根据匹配到的变量条件驱动虚拟人物执行相应动作。本发明通过语音控制方式直接驱动虚拟人物动作,简化了虚拟人物的操作过程,减少了现实中的肢体交互动作,使得虚拟人物的控制方式更加简单、方便。
技术领域
本发明涉及运动仿真和动画游戏技术领域,具体涉及一种实时语音驱动虚拟人物动作的方法和系统。
背景技术
VR(Virtual Reality)虚拟现实技术,又称灵境技术,是20世纪发展起来的一项全新的实用技术。虚拟现实技术囊括计算机、电子信息、仿真技术于一体,其基本实现方式是计算机模拟虚拟环境从而给人以环境沉浸感。
随着虚拟现实技术的发展,人们已经不再满足于作为观看者,人们更希望参与到观看到的VR场景中,目前较为普遍的VR场景交互方式为用户通过佩戴VR头盔以第一视角沉浸在VR场景中,然后利用操作手柄进行姿态变换、物体抓取等动作实现与VR场景的交互。但现有的这种交互方式建立在肢体动作或手动操作基础上,对于虚拟人物的操作还不够简单,没法通过实时语音驱动方式直接驱动虚拟人物动作。
发明内容
本发明的目的在于提供一种实时语音驱动虚拟人物动作的方法和系统,通过语音控制方式直接驱动虚拟人物动作,简化了虚拟人物的操作过程,减少了现实中的肢体交互动作,使得虚拟人物的控制方式更加简单、方便。
为达此目的,本发明采用以下技术方案:
提供一种实时语音驱动虚拟人物动作的方法,包括:
利用Unity引擎(但并不局限于Unity游戏引擎,所有实时游戏引擎都支持,例如Unreal游戏引擎等。)建立虚拟人物动作场景;
为所述虚拟人物执行不同动作添加相对应的变量条件;
将语音接口集成到Unity引擎中;
获取语音数据;
将获取到的所述语音数据通过所述语音接口上传给一语音识别系统,所述语音识别系统对所述语音数据进行内容识别后输出语音识别结果;
所述Unity引擎通过所述语音接口接收所述语音识别结果,并根据语音识别结果匹配虚拟人物动作变量条件;
所述Unity引擎根据匹配到的所述变量条件驱动所述虚拟人物执行相应动作。
作为本发明的一种优选方案,集成在所述Unity引擎中的所述语音接口由第三方语音平台提供。
作为本发明的一种优选方案,第三方语音平台提供的所述语音接口包括不限于百度AI开放平台提供的REST API语音接口或谷歌公司提供的Android SDK接口。
作为本发明的一种优选方案,所述语音识别系统通过一语音识别模型对所述语音数据进行内容识别,所述语音识别模型通过RBM受限玻尔兹曼机随机神经网络训练而得。
作为本发明的一种优选方案,驱动所述虚拟人物动作的方法通过以下公式(1)表达:
公式(1)中,表示虚拟人物骨骼模型的运动变形;
为表示虚拟人物骨骼模型上的关节j1的运动姿态的对偶四元数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科深智科技有限公司,未经北京中科深智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010836241.5/2.html,转载请声明来源钻瓜专利网。





