[发明专利]语音识别方法及其装置和语音识别系统在审
申请号: | 201810848234.X | 申请日: | 2018-07-27 |
公开(公告)号: | CN110767214A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 陈展;齐昕 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L15/30;H04N7/18;H04N5/232 |
代理公司: | 11415 北京博思佳知识产权代理有限公司 | 代理人: | 林祥 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音音素 预设 概率 音频信号 语音 语音识别系统 语音识别装置 概率获取 声学模型 特征提取 硬件要求 语音识别 计算量 应用 | ||
本发明公开了一种语音识别装置及其装置和语音识别系统,该方法包括:对获取的音频信号进行特征提取,得到多个语音特征值;将所述多个语音特征值输入到声学模型中进行识别,得到多个发音音素的概率;根据所述多个发音音素的概率获取其中若干个连续发音音素组成预设关键词的概率;判断组成所述预设关键词的概率是否大于概率阈值,若是,则确定所述音频信号中存在所述预设关键词。该方法可以降低语音识别的计算量,降低应用该识别方法的硬件要求。
技术领域
本发明涉及语音识别技术领域,尤其涉及语音识别装置及其装置和语音识别系统。
背景技术
语音识别技术为一种能够对语音数据进行识别的技术,语音识别技术可应用于人机交互设备、安防监控系统等领域。
目前有一种语音识别方法中可以对采集的连续语音数据进行识别后转换为文本文字,然后从文本文字中提取关键词,根据提取的关键词进行对应的处理,这种语音识别方法计算量较大,对硬件的要求较高。
发明内容
本发明提供一种语音识别方法及其装置和语音识别系统,以解决相关技术中的不足。
根据本发明实施例的第一方面,提供一种语音识别方法,包括:
对获取的音频信号进行特征提取,得到多个语音特征值;
将所述多个语音特征值输入到声学模型中进行识别,得到多个发音音素的概率;
根据所述多个发音音素的概率获取其中若干个连续发音音素组成预设关键词的概率;
判断组成所述预设关键词的概率是否大于概率阈值,若是,则确定所述音频信号中存在所述预设关键词。
可选的,在所述对获取的音频信号进行特征提取,得到多个语音特征值之前,还包括;
判断所述音频信号中是否存在语音信号;
若是,则执行对获取的音频信号进行特征提取,得到多个语音特征值的步骤。
可选的,在确定所述音频信号中存在所述预设关键词之后,还包括:
判断确定出的所述预设关键词是否属于预警关键词;
若是,通过监控设备拍摄图像和/或录制视频,根据所述图像或者所述视频进行人脸检测或行为检测。
可选的,在判断确定出的所述预设关键词属于预警关键词之后,还包括:
获取所述监控设备的标识信息;
根据所述标识信息获取所述监控设备所在地址。
根据本发明实施例的第二方面,提供一种语音识别装置,包括:
语音特征值提取单元,用于对获取的音频信号进行特征提取,得到多个语音特征值;
发音音素概率获取单元,用于将所述多个语音特征值输入到声学模型中进行识别,得到多个发音音素的概率;
关键词概率获取单元,用于根据所述多个发音音素的概率获取其中若干个连续发音音素组成预设关键词的概率;
关键词确定单元,用于判断组成所述预设关键词的概率是否大于概率阈值,若是,则确定所述音频信号中存在所述预设关键词。
可选的,还包括:语音信号判断单元,用于判断所述音频信号中是否存在语音信号,若是,则执行对获取的音频信号进行特征提取的步骤。
可选的,还包括:
预警关键词判断单元,用于判断确定出的所述预设关键词是否属于预警关键词,若是,通过监控设备拍摄图像和/或录制视频,根据所述图像或者所述视频进行人脸检测和/或行为检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810848234.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种韵律预测方法及装置
- 下一篇:一种训练语音识别模型、识别语音的方法及装置