[发明专利]梦呓识别方法、装置和电子设备在审

申请号：	202110675022.8	申请日：	2021-06-18
公开（公告）号：	CN113421586A	公开（公告）日：	2021-09-21
发明（设计）人：	竹东翔;程齐明	申请（专利权）人：	南京优博一创智能科技有限公司
主分类号：	G10L25/24	分类号：	G10L25/24;G10L25/30;G10L21/0232
代理公司：	北京知果之信知识产权代理有限公司 11541	代理人：	卜荣丽
地址：	210009 江苏省南京***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	梦呓识别方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种梦呓识别方法、装置和电子设备，其中方法包括：获取音频信号，确定音频信号中各帧的响度、线性频谱能量和梅尔频谱能量；根据各帧的响度确定背景噪音响度；根据各帧的响度和背景噪音响度确定出有声片段；根据各帧的梅尔频谱能量，输入神经网络鼾声预测模型，从有声片段中识别出非鼾声片段；确定所述非鼾声片段中各帧的线性频谱能量极值信息，并根据预设梦呓规则以及线性频谱能量极值信息，从非鼾声片段中识别出梦呓片段。本申请的方法逻辑严谨，能够从复杂的音频信号中准确识别出用户的梦呓的声音，有效排除背景噪音和用户鼾声的干扰，为监控用户的睡眠质量提供了坚实的基础，弥补了对梦呓识别的技术空白。

技术领域

本申请涉及人工智能技术领域，尤其涉及梦呓识别方法、装置和电子设备。

背景技术

梦呓是是一种睡眠障碍，用户在睡眠质量监测中，有强烈的需求想了解自我是否存在梦呓和梦呓的严重程度。

目前的语音识别技术包括语音到文字的转化，方言识别，或不同语言之间的翻译等。但是对于梦呓的识别目前没有比较成熟的技术。

由于梦呓在睡觉过程中发生，而非人们清醒状态，多是含混不清，非清晰表达的语音，另外，睡觉环境中，打鼾是一种常见现象，鼾声与梦呓在频域特征有时非常相似，这使准确识别梦呓变得更加困难，所以对于梦呓的识别不通过照搬现有的语音识别技术。因此，亟待一种准确、高效的梦呓识别方法，为用户梦呓的提供评估与改善提供基础。

发明内容

本申请实施例提供了一种梦呓识别方法、装置和电子设备，以解决或至少部分解决上述问题。

根据本申请的第一方面，提供了一种梦呓识别方法，包括：

获取音频信号，确定所述音频信号中各帧的响度、线性频谱能量和梅尔频谱能量；

根据所述各帧的响度确定背景噪音响度；

根据各帧的响度和所述背景噪音响度确定出有声片段；

根据各帧的梅尔频谱能量，输入神经网络鼾声预测模型，从所述有声片段中识别出非鼾声片段；

确定所述非鼾声片段中各帧的线性频谱能量极值信息，并根据预设梦呓规则以及所述线性频谱能量极值信息，从所述非鼾声片段中识别出梦呓片段。

根据本申请的另一方面，提供了一种梦呓识别装置，包括：

获取单元，用于获取音频信号，确定所述音频信号中各帧的响度、线性频谱能量和梅尔频谱能量；

确定单元，用于根据所述各帧的响度确定背景噪音响度；

第一识别单元，用于根据各帧的响度和所述背景噪音响度确定出有声片段；

第二识别单元，用于根据各帧的梅尔频谱能量，输入神经网络鼾声预测模型，从所述有声片段中识别出非鼾声片段；

第三识别单元，用于确定所述非鼾声片段中各帧的线性频谱能量极大值，并根据预设规则以及所述各帧的线性频谱能量极大值，从非鼾声片段中识别出梦呓片段。

根据本申请的另一方面，提供了一种电子设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行上述任一的方法。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

首先根据组成音频信号的各帧的响度确定当前环境的背景噪音响度，在背景噪音响度以上的片段被标记为有声片段，进一步的，基于神经网络鼾声预测模型，从有声片段中排除鼾声的影响，识别出非鼾声片段，在非鼾声片段中，根据各帧的线性频谱能量极值信息与预设规则最终识别出梦呓片段。本申请的方法逻辑严谨，能够从复杂的音频信号中准确识别出用户的梦呓的声音，有效排除背景噪音和用户鼾声的干扰，为监控用户的睡眠质量提供了坚实的基础，弥补了对梦呓识别的技术空白。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京优博一创智能科技有限公司，未经南京优博一创智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110675022.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种RIS辅助多载波NOMA传输系统参数优化方法
下一篇：具备多重保护功能的高压型相控阵雷达激励器

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]梦呓识别方法、装置和电子设备在审

专利文献下载