[发明专利]应用场景识别的多媒体播放系统及方法在审
申请号: | 202010648167.4 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111918106A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 胡飞青 | 申请(专利权)人: | 胡飞青 |
主分类号: | H04N21/41 | 分类号: | H04N21/41;H04N21/439;H04N21/442;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 315800 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用 场景 识别 多媒体 播放 系统 方法 | ||
本发明涉及一种应用场景识别的多媒体播放系统,包括:命令识别设备,与信号处理设备连接,用于对第三信号中的人员声音进行识别以获得对应的人员外部命令;LED显示阵列,用于在接收到的所述第三信号中的人员声音信号的波形幅度超限时,执行接收到的动态图案的动态显示;MCU控制芯片,设置在多媒体播放终端内部,用于基于接收到的人员外部命令执行相应的多媒体文件的播放控制。本发明还涉及一种应用场景识别的多媒体播放方法。本发明的应用场景识别的多媒体播放系统及方法操作智能、应用广泛。由于在识别人员声控命令的同时去除多媒体播放终端本身播放音频信号,从而有效提升了声控命令的识别精度。
技术领域
本发明涉及多媒体播放控制领域,尤其涉及一种应用场景识别的多媒体播放系统及方法。
背景技术
多媒体播放终端是能综合各种不同媒体(话音、文字、数据、图像和活动影像等),集电话机、电报机、传真机、电视机和计算机等为一体的新型通信终端。作为通信网与用户之间直接的接口,通信终端是通信网的能力和性能的最终体现者,因而在整个通信技术的发展中多媒体终端占有十分重要的地位。
多媒体系统播放终端的用户通过多媒体终端对多媒体信息进行访问,这些终端通过高速通信网络连接起来,共享多媒体信息。
多媒体系统播放终端是指利用计算机技术和数字通讯网技术来处理和控制多媒体信息的系统播放终端。
发明内容
为了解决相关领域的技术问题,本发明提供了一种应用场景识别的多媒体播放系统及方法,能够在识别人员声控命令的同时去除多媒体播放终端本身播放音频信号以提升识别精度,同时模拟发声控制的人体脸部的各个器官的分布布局以执行开口说话的动态图案的绘制,增强了多媒体播放终端的互动性。
为此,本发明至少需要具备以下两处重要的发明点:
(1)为了克服在识别人员声音中的控制命令时多媒体播放终端本身播放音频信号带来的干扰,在执行人员声音识别时去除多媒体播放终端本身的音频信号;
(2)基于最近人员的脸部轮廓和各个脸部器官的相对位置绘制与所述最近人员脸型匹配的动态模拟图案,以在检测到人员声音时执行相应动态模拟图案的动态展示,增加了多媒体播放终端的趣味性。
根据本发明的一方面,提供了一种应用场景识别的多媒体播放系统,所述系统包括:
前置摄像机构,位于多媒体播放终端的外壳上,用于对所述多媒体播放终端的播放环境执行摄像动作,以获得并输出相应的播放环境图像;
轮廓辨识设备,与所述前置摄像机构连接,用于基于人体脸部轮廓识别所述播放环境图像中面积最大的人体脸部区域;
布局检测设备,与所述轮廓辨识设备连接,用于识别所述面积最大的人体脸部区域的几何外形以及识别其内部各个脸部器官,并基于所述各种脸部器官在所述几何外形中的各自的位置以及所述几何外形描绘当前脸部目标的模拟图案;
动态绘制设备,与所述布局检测设备连接,用于基于所述模拟图案对其中的嘴部器官执行说话的动态绘制以获得所述模拟图案对应的动态图案;
数据获取设备,设置在所述多媒体播放终端内部,用于获取所述多媒体播放终端当前正在播放的多媒体文件的音频信号以作为第一信号;
内容捕获设备,位于所述多媒体播放终端的外壳上,用于实时采集所述多媒体播放终端所在环境的音频信号以作为第二信号;
信号处理设备,分别与所述数据获取设备和所述内容捕获设备连接,用于将所述第二信号中将所述第一信号剥离出去以获得相应的第三信号;
命令识别设备,与所述信号处理设备连接,用于对所述第三信号中的人员声音进行识别以获得对应的人员外部命令;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡飞青,未经胡飞青许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010648167.4/2.html,转载请声明来源钻瓜专利网。