[发明专利]梦呓识别方法、装置和电子设备在审
申请号: | 202110675022.8 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113421586A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 竹东翔;程齐明 | 申请(专利权)人: | 南京优博一创智能科技有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L21/0232 |
代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 卜荣丽 |
地址: | 210009 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 梦呓 识别 方法 装置 电子设备 | ||
本申请公开了一种梦呓识别方法、装置和电子设备,其中方法包括:获取音频信号,确定音频信号中各帧的响度、线性频谱能量和梅尔频谱能量;根据各帧的响度确定背景噪音响度;根据各帧的响度和背景噪音响度确定出有声片段;根据各帧的梅尔频谱能量,输入神经网络鼾声预测模型,从有声片段中识别出非鼾声片段;确定所述非鼾声片段中各帧的线性频谱能量极值信息,并根据预设梦呓规则以及线性频谱能量极值信息,从非鼾声片段中识别出梦呓片段。本申请的方法逻辑严谨,能够从复杂的音频信号中准确识别出用户的梦呓的声音,有效排除背景噪音和用户鼾声的干扰,为监控用户的睡眠质量提供了坚实的基础,弥补了对梦呓识别的技术空白。
技术领域
本申请涉及人工智能技术领域,尤其涉及梦呓识别方法、装置和电子设备。
背景技术
梦呓是是一种睡眠障碍,用户在睡眠质量监测中,有强烈的需求想了解自我是否存在梦呓和梦呓的严重程度。
目前的语音识别技术包括语音到文字的转化,方言识别,或不同语言之间的翻译等。但是对于梦呓的识别目前没有比较成熟的技术。
由于梦呓在睡觉过程中发生,而非人们清醒状态,多是含混不清,非清晰表达的语音,另外,睡觉环境中,打鼾是一种常见现象,鼾声与梦呓在频域特征有时非常相似,这使准确识别梦呓变得更加困难,所以对于梦呓的识别不通过照搬现有的语音识别技术。因此,亟待一种准确、高效的梦呓识别方法,为用户梦呓的提供评估与改善提供基础。
发明内容
本申请实施例提供了一种梦呓识别方法、装置和电子设备,以解决或至少部分解决上述问题。
根据本申请的第一方面,提供了一种梦呓识别方法,包括:
获取音频信号,确定所述音频信号中各帧的响度、线性频谱能量和梅尔频谱能量;
根据所述各帧的响度确定背景噪音响度;
根据各帧的响度和所述背景噪音响度确定出有声片段;
根据各帧的梅尔频谱能量,输入神经网络鼾声预测模型,从所述有声片段中识别出非鼾声片段;
确定所述非鼾声片段中各帧的线性频谱能量极值信息,并根据预设梦呓规则以及所述线性频谱能量极值信息,从所述非鼾声片段中识别出梦呓片段。
根据本申请的另一方面,提供了一种梦呓识别装置,包括:
获取单元,用于获取音频信号,确定所述音频信号中各帧的响度、线性频谱能量和梅尔频谱能量;
确定单元,用于根据所述各帧的响度确定背景噪音响度;
第一识别单元,用于根据各帧的响度和所述背景噪音响度确定出有声片段;
第二识别单元,用于根据各帧的梅尔频谱能量,输入神经网络鼾声预测模型,从所述有声片段中识别出非鼾声片段;
第三识别单元,用于确定所述非鼾声片段中各帧的线性频谱能量极大值,并根据预设规则以及所述各帧的线性频谱能量极大值,从非鼾声片段中识别出梦呓片段。
根据本申请的另一方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述任一的方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
首先根据组成音频信号的各帧的响度确定当前环境的背景噪音响度,在背景噪音响度以上的片段被标记为有声片段,进一步的,基于神经网络鼾声预测模型,从有声片段中排除鼾声的影响,识别出非鼾声片段,在非鼾声片段中,根据各帧的线性频谱能量极值信息与预设规则最终识别出梦呓片段。本申请的方法逻辑严谨,能够从复杂的音频信号中准确识别出用户的梦呓的声音,有效排除背景噪音和用户鼾声的干扰,为监控用户的睡眠质量提供了坚实的基础,弥补了对梦呓识别的技术空白。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京优博一创智能科技有限公司,未经南京优博一创智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110675022.8/2.html,转载请声明来源钻瓜专利网。