[发明专利]一种话务环境下单通道语音分离方法在审
申请号: | 202111168264.4 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113921033A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 刘奔;余关元;常晋源;何婧;林昱;李殷;周成 | 申请(专利权)人: | 四川新网银行股份有限公司;西南财经大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L25/78 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 话务 环境 通道 语音 分离 方法 | ||
本发明属于音频数据分离技术领域,具体涉及一种话务环境下单通道语音分离方法。本发明根据录音通话材料,以不同话务员为分组标识进行分组,对每个话务员的通话录音进行切分,对切分后的片段进行活性检测和停顿检测,剔除无声片段,切分明显停顿的片段;进行再切分处理,基于声学特征对不同的语音片段进行编码,根据相似度找出话务员的片段并进行合并,至此完成了话务员与客户通话的单通道录音的语音分离,并且本发明无需预先收集每个话务员的语音,也不用多次建立模型。
技术领域
本发明属于音频数据分离技术领域,具体涉及一种话务环境下单通道语音分离方法。
背景技术
目前,在各行业中,逐渐采用电话沟通的方式进行营销、催收、售后;随着相同行业间竞争的激烈,公司在人力和财力的投入下,希望电话业务能够起到较好的效果;故对话务员的具体工作绩效考核或者是防止消费纠纷而进行通话内容的录音是目前企业的常规做法。目前,常采用的录音设备采用双轨音频技术,可以分别储存通话双方的语音信息;但由于设备和迁移成本的问题,仍然有大量企业采用单轨录音设备,而对于单轨录音设备录制的音频,难以针对业务员的话术水平进行针对性分析,以及是否使用忌讳词句问题进行分析。
经过检索发现公开号为CN111785291A的发明专利申请,公开了一种语音分离方法和语音分离装置,其主要是将语音分为多个片段,然后通过分离模型进行分类,得到各个说话人的语音片段集合;分离模型的建立需要预先采集每个话务员的声纹特征;且分离模型至少需要重新建立两次,每次建立时根据当前的语音数据库建立,且任意两次建立的分离模型为根据不同的语音数据库建立。上述方法通过重建进行修正,以确保语音片段集合中的目标语音片段为同一个话务员的语音,从而提高语音分离的准确率。
但是,采用上述方法进行语音分离需要预先获取话务员的语音数据,进而获取对应的声纹特征,应用到分离模型中。对于大规模的话务团队而言,预先收集每个话务员的语音数据费时费力,且需要多次根据语音数据库建立模型,来提高语音分离的准确率;尽快其能够提高语音分离的准确率,但是多次建立模型也将造成费时费力的问题。
发明内容
本发明公开了一种话务环境下单通道语音分离方法,拟解决背景技术中提到的预先收集每个话务员的语音数据以及多次建立模型造成费时费力的问题。
为解决上述技术问题,本发明采用的技术方案如下:
一种话务环境下单通道语音分离方法,包括以下步骤:
步骤1:根据通话录音材料,以不同的话务员为分组标识进行分组,整合每个话务员的通话录音材料;
步骤2:对每个话务员通话录音材料的音频进行切分;并对切分片段进行活性检测和停顿检测,将音频中无声片段删除,将停顿明显的部分做切开处理;
步骤3:对步骤2中切分的片段做再次切分,并对各个切分后的片段,根据声学特征对不同类型的语音片段进行编码,组成多个矩阵;
步骤4:在步骤3中切分后的片段中根据相似度找出话务员的片段,并对话务员的相似片段进行合并。
本发明通过对音频做切分处理后进行活性检测以及停顿检测,实现了无声片段的剔除,以及明显停顿部分做切开处理,并且再次对切分处理后的片段进行再切分处理,根据声学特征,对不同类型的语音进行编码,根据相似度找出话务员的语音片段后进行合并,实现了话务员与客户通话的单通道录音的语音分离,并且本发明无需预先收集每个话务员的语音,也不用多次建立模型。
优选的,所述步骤2基于开源的pyannote库对每个话务员通话录音材料的音频进行切分。
本发明基于开源的pyannote库对每个话务员通话录音材料的音频进行切分,进而实现活性检测以及停顿检测。
优选的,所述步骤3包括以下步骤:
步骤3.1:以步长为t秒对步骤2中切分的片段再次进行切分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司;西南财经大学,未经四川新网银行股份有限公司;西南财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111168264.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:射频开关器件及其制造方法
- 下一篇:制备补锂负极的方法以及补锂负极