[发明专利]基于AI语音识别的可视化表现系统和方法在审

申请号：	202010794360.9	申请日：	2020-08-10
公开（公告）号：	CN111951802A	公开（公告）日：	2020-11-17
发明（设计）人：	周安斌;汤祯科;宋健健;尚绪峰	申请（专利权）人：	山东金东数字创意股份有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/30;G10L15/34;G06F40/58
代理公司：	武汉聚信汇智知识产权代理有限公司 42258	代理人：	刘丹
地址：	266000 山东省青岛市市南区银川西***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 ai 语音识别可视化表现系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于AI语音识别的可视化表现系统，其特征在于，包括：采集模块、语音唤醒模块、语音识别模块、主机模块和显示模块；

采集模块，用于采集发出各种的声音，并进行处理得到声音数据，将采集得到的声音数据发送到所述语音唤醒模块；

其中，所述采集模块包括声音采集单元、过滤单元、过滤数据存储单元和输出端，所述声音采集单元用于采集发出的各种声音得到声音数据，并将采集的声音数据发送到所述过滤单元，所述过滤数据存储单元用于存储声音过滤数据，所述过滤单元用于接收所述声音采集单元发送的声音数据，并与所述过滤数据存储单元中存储的声音过滤数据进行比对，将相同的部分消除，将不相同的部分声音数据通过所述输出端发送到所述语音唤醒模块和所述语音识别模块；

语音唤醒模块，用于接所述采集模块发送的声音数据并进行分析，在分析到出现唤醒词时，将触发信号发送到所述主机模块；

其中，语音唤醒模块包括接收端、唤醒词存储单元、语音分析单元和信号触发单元，所述接收端用于接收所述采集模块发送的声音数据，将声音数据发送到所述语音分析单元，所述唤醒词存储单元用于存储预设的唤醒词，所述语音分析单元用于接收所述接收端发送的声音数据，还用于读取存储单元存储预设的唤醒词并与接收端发送的声音数据进行对比，在声音数据中出现与唤醒词相同的词后，所述信号触发单元发送唤醒信号到所述语音识别模块；

语音识别模块，用于接收所述采集模块发送的语音数据，接收所述语音唤醒模块发送的唤醒信号，还用于在唤醒信号后对语音数据进行分析得到控制信号，将控制信号发送到主机模块；

其中，所述语音识别模块包括语音数据库、语音识别单元和信号输出端口，所述语音数据库用于存储语音比对数据，所述语音识别单元用于根据语音数据库存储的语音比对数据对采集模块发送的语音数据进行识别，将语音转化成控制信号，所述信号输出端口用于将控制信号发送到所述主机模块；

主机模块，用于接收所述语音识别模块发送的控制信号，并对接收到的控制信号进行分析，读取对应的影音视频数据并播放，将影音视频信号传输到所述显示模块；

其中，主机模块包括信号接收端口、信号分析单元、影音数据存储单元、视频播放单元和视频信号输出端口，信号接收端口用于采集所述语音识别模块发送的控制信号，将控制信号发送到所述信号分析单元，所述信号分析单元用于对控制信号进行分析将分析结果数据发送到所述视频播放单元，所述影音数据存储单元用于存储影音视频数据，所述视频播放单元用于接收所述信号分析单元发送的分析结果数据，并根据分析结果数据播放所述影音数据存储单元中对应的影音视频数据产生影音视频信号，所述视频信号输出端口用于将影音视频信号传输到所述显示模块；

显示模块，用于接收所述主机模块发送的影音视频信号并进行播放。

2.如权利要求1所述的基于AI语音识别的可视化表现系统，其特征在于，所述声音采集单元为麦克风或拾音器中任一种。

3.如权利要求1所述的基于AI语音识别的可视化表现系统，其特征在于，所述过滤数据存储单元存储的声音过滤数据为各种噪声的波形数据，该各种噪声的波形数据用于与所述声音采集单元采集发的声音数据进行对比去除与人声混合在一起的噪声。

4.如权利要求1所述的基于AI语音识别的可视化表现系统，其特征在于，所述唤醒词存储单元存储预设的唤醒词由用户进行预设，该唤醒词为预设的波形数据。

5.如权利要求1所述的基于AI语音识别的可视化表现系统，其特征在于，所述语音数据库存储的语音比对数据包括语音波形数据和控制信号数据，用于与所述采集模块发送的语音数据的特征进行比对得到对应的指令数据。

6.基于AI语音识别的可视化表现的方法，应用于如权利要求1-5任一项所述的基于AI语音识别的可视化表现系统，其特征在于，包括以下步骤：

S1，语音采集，声音采集单元采集发出的各种声音得到声音数据，并将采集的声音数据发送到过滤单元，过滤数据存储单元存储声音过滤数据，过滤单元接收声音采集单元发送的声音数据与过滤数据存储单元中存储的声音过滤数据进行比对，将相同的部分消除，将不相同的部分声音数据通过输出端发送到接收端和语音识别单元；

S2，语音唤醒，接收端接收输出端发送的声音数据，将声音数据发送到语音分析单元，唤醒词存储单元存储预设的唤醒词，语音分析单元接收端发送的声音数据，同时读取存储单元存储预设的唤醒词并与接收端发送的声音数据进行对比，在声音数据中出现与唤醒词相同的词后，信号触发单元发送唤醒信号到语音识别模块；

S3，语音分析，语音数据库存储语音比对数据，语音识别单元接收到信号触发单元发送唤醒信号被唤醒，根据语音数据库存储的语音比对数据对输出端发送的语音数据进行识别，将语音转化成控制信号，信号输出端口将控制信号发送到信号接收端口；

S4，视频播放，信号接收端口采集信号输出端发送的控制信号，将控制信号发送到信号分析单元，信号分析单元对控制信号进行分析将分析结果数据发送到视频播放单元，影音数据存储单元存储影音视频数据，视频播放单元接收信号分析单元发送的分析结果数据，并根据分析结果数据播放影音数据存储单元中对应的影音视频数据产生影音视频信号，视频信号输出端口将影音视频信号传输到显示模块进行播放。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东金东数字创意股份有限公司，未经山东金东数字创意股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010794360.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种应用于多深度场景的扩展傅里叶梅林定位算法
下一篇：应用服务器异常预测方法及系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于AI语音识别的可视化表现系统和方法在审

专利文献下载