[发明专利]一种文本提取方法、系统、设备及介质有效
申请号: | 202110723349.8 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113257253B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 姚娟娟;钟南山;樊代明 | 申请(专利权)人: | 明品云(北京)数据科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L15/26 |
代理公司: | 上海汉之律师事务所 31378 | 代理人: | 冯华 |
地址: | 102400 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 提取 方法 系统 设备 介质 | ||
1.一种文本提取方法,其特征在于,包括以下步骤:
获取在目标区域形成的第一音频数据;
对所述第一音频数据进行声纹识别,获取对应的目标声纹信息;
将所述目标声纹信息与标准声纹信息进行比对识别,判断所述目标声纹信息中是否存在目标对象的声纹信息;其中,所述标准声纹信息仅包含所述目标对象的声纹信息;
若所述目标声纹信息中存在所述目标对象的声纹信息,则从所述第一音频数据中截取出包括有所述目标对象的第二音频数据,并对所述第二音频数据进行语音识别,获取第二语音识别文本;
获取预先确定的关键词,并从所述第二语音识别文本中提取出与所述关键词关联的文本,作为目标文本;
若所述目标声纹信息中不存在所述目标对象的声纹信息,则还包括:
判断所述第一音频数据中是否存在不同的音频特征;所述音频特征包括:音调、响度和音色;
若不存在不同的音频特征,则对所述第一音频数据进行语音识别,获取第一语音识别文本,以及按照预先确定的关键词从所述第一语音识别文本中提取出与所述关键词关联的文本,作为目标文本;
若存在不同的音频特征,则按照存在的音频特征的数量将所述第一音频数据分割为多个第三音频数据,并对多个所述第三音频数据进行语音识别,获取对应的多个第三语音识别文本,以及按照预先确定的关键词从多个所述第三语音识别文本中提取出与所述关键词关联的文本,作为目标文本。
2.根据权利要求1所述的文本提取方法,其特征在于,在对所述第一音频数据进行声纹识别前,还包括:
确定出所述第一音频数据中仅包含有人声的音频片段和不包含人声的音频片段;
计算每个仅包含人声的音频片段的音频能量值,并对所有的音频能量值进行求和,得到第一音频能量值;
计算每个不包含人声的音频片段的音频能量值,并对所有的音频能量值进行求和,得到第二音频能量值;
根据所述第一音频能量值和所述第二音频能量值计算所述第一音频数据的信噪比,并判断所述信噪比是否大于预设阈值;
若所述信噪比大于所述预设阈值,则从所述第一音频数据中分别截取出所有仅包含有人声的音频片段和所有不包含人声的音频片段,并对所有仅包含有人声的音频片段进行降噪处理,以及对所有不包含人声的音频片段进行噪声抑制处理;
若所述信噪比小于等于预设阈值,则直接对所述第一音频数据进行降噪处理。
3.根据权利要求2所述的文本提取方法,其特征在于,对仅包含有人声的音频片段进行降噪处理的过程包括:
对仅包含有人声的音频片段进行分帧、加窗和傅里叶变换,获取对应的频谱;
获取所述频谱的幅度特征序列和相位特征序列,并将所述幅度特征序列和相位特征序列输入至循环网络中,获取对应的幅度循环特征序列和相位循环特征序列;
分别将所述幅度循环特征序列和相位循环特征序列输入至池化网络中,获取对应的池化幅度特征向量序列和池化相位特征向量序列;
将所述池化幅度特征向量序列和所述池化相位特征向量序列进行融合,生成融合池化频谱特征向量序列;所述融合包括:相加、相减和/或拼接;
将所述融合池化频谱特征向量序列输入至全连接网络中,并对所述全连接网络的输出进行傅里叶逆变换,获取降噪后的仅包含人声的音频片段。
4.根据权利要求2所述的文本提取方法,其特征在于,对所有不包含人声的音频片段进行噪声抑制处理的过程包括:
将所有不包含人声的音频片段输入至预设的神经网络模型中进行分类,获取每个不包含人声的音频片段的置信度;
判断每个不包含人声的音频片段的置信度是否大于或等于目标音频类型的预设置信度阈值,并根据判断结果确定每个不包含人声的音频片段的音频类型;
获取与所述音频类型对应的噪声跟踪方法,并根据所述噪声跟踪方法对所述不包含人声的音频片段进行噪声跟踪,获取每个不包含人声的音频片段的噪声能量;
获取每个不包含人声的音频片段的音频能量值,并利用所述音频能量值减去所述噪声能量,完成对所述不包含人声的音频片段的噪声抑制处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于明品云(北京)数据科技有限公司,未经明品云(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110723349.8/1.html,转载请声明来源钻瓜专利网。