[发明专利]一种基于人工智能获取RGB视频中3D表情的算法在审
| 申请号: | 202010215726.2 | 申请日: | 2020-03-25 |
| 公开(公告)号: | CN111460945A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 高立艳;何書廉;陆晓飞;徐阳;刘烨斌;方浩树 | 申请(专利权)人: | 亿匀智行(深圳)科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 人工智能 获取 rgb 视频 表情 算法 | ||
本发明公开了一种基于人工智能获取RGB视频中3D表情的算法,包括以下步骤:S1、服务器端接收包含人脸的RGB视频信息;S2、从视频中计算出人脸的位置;S3、从视频中计算出人脸特征点检测;S4、对人脸信息进行数据标准化;S5、提取人脸信息的特征数据;S6、将特征数据输入到本地存储的深度学习模型;S7、深度学习模型计算出Blend Shape数值;S8、对输出的出Blend Shape数值进行自动优化。本发明的优点在于:无需过多硬件设备、可输出详细的Blend Shape数值、可应用于3D动画制作。
技术领域
本发明涉及表情识别领域,具体是指一种基于人工智能获取RGB视频中3D表情的算法。
背景技术
随着科技的进步,以深度学习为基础的视频分析技术发展迅速,如:姿态估计,动作跟踪, 人脸特征点检测等,大量重要讯息都可从视频及图像中以计算器视觉算法抽取出来。
对于从视频中对面部表情进行识别,现在的技术一般只输出简陋的信息,如:喜、怒、哀、乐等,作面部表情的标签,或是绑定在某一品牌智能手机的 API 开发软件上,如:苹果手机的ARKit。
发明内容
本发明要解决的技术问题是,针对上述问题,提出一种无需过多硬件设备、可输出详细的Blend Shape 数值、可应用于3D动画制作的基于人工智能获取RGB视频中3D表情的算法。
为解决上述技术问题,本发明提供的技术方案为:一种基于人工智能获取RGB视频中3D表情的算法,包括以下步骤:
一种基于人工智能获取RGB视频中3D表情的算法,包括以下步骤:
S1、用户经网络接口上传视频到服务器,服务器端接收包含人脸的RGB视频信息;
S2、从视频中取出每一帧并以图像格式作暂存,并把每一张图片输入 DLib 的人脸关键点侦测系统以取得关键点的 X 及 Y 坐标;
S3、基于取得的关键点坐标抽取人脸特征,以人脸不同部份区分特征点群;
S4、对每一个特征点群进行数据标准化,以 P = {p1, p2, ..., pn} 为所有(n个)特征点为例,标准化的特征点群P’计算公式为:
Q = P / (max(P) – min(P))
P’= Q - mean(Q);
S5、提取人脸信息的特征数据,已标准化的特征点群将成为不同的特征数据;
S6、将特征数据输入到本地存储的深度学习模型;
S7、深度学习模型计算出Blend Shape数值,以特征数据 P’作输入并计算出BlendShape数值bs,公式为:
bs = P’ * M + b
其中 M 及 b 将从深度学习训练过程中求取;
S8、对输出的出Blend Shape数值进行自动优化。
进一步的,所述S1中服务器接收的人脸信息为用户选择的人脸信息。
进一步的,所述S3中的特征点群包括左眼眉、右眼眉、左眼、右眼、鼻子及嘴巴。
进一步的,所述S7中深度学习模型利用多层神经网络,在训练数据中学习人脸信息的特征数据与Blend Shape数值的相关性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亿匀智行(深圳)科技有限公司,未经亿匀智行(深圳)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010215726.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有节能效果的夜间照明系统
- 下一篇:访客车辆管理方法及系统





