[发明专利]语音对话的处理方法、系统、设备和存储介质有效

申请号：	201910910610.8	申请日：	2019-09-25
公开（公告）号：	CN110650250B	公开（公告）日：	2022-03-08
发明（设计）人：	王黎黎;赵桦	申请（专利权）人：	携程旅游信息技术（上海）有限公司
主分类号：	H04M3/22	分类号：	H04M3/22;G10L15/26;G06F16/332
代理公司：	上海弼兴律师事务所 31283	代理人：	薛琦;张冉
地址：	201203 上海市浦东新***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音对话处理方法系统设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音对话的处理方法、系统、设备及存储介质，该方法包括：将语音对话双方的媒体流录制在不同声道，生成一录音文件；将录音文件拆分成左、右声道录音文件；对左、右声道录音文件分别进行切片处理，生成若干个包含第一、第二开始时间的左、右声道录音切片文件；对若干个左、右声道录音切片文件分别进行语音识别，生成若干个包含第一、第二开始时间的左、右声道切片文本；根据第一、第二开始时间对若干个左、右声道切片文本进行排序，生成语音对话的对话文本文件。本发明将语音对话的音频文件转化成对话形式的对话文本，可以明确区分对话双方，并且切片后的录音切片文件语义相关度提高且长度降低，可大大提高了语音的识别率。

技术领域

本发明涉及语音的自动化处理领域，尤其涉及一种语音对话的处理方法、系统、设备和存储介质。

背景技术

现阶段很多企业对外呼通话有质量或者其它要求，然而语音形式的文件很不利于检查，通话录音调听的过程需要投入大量的人力、物力及时间。为了节约成本，同时提高调听的便利性，采用文字的方式替换传统的录音调听模式会更高效。但是现有的语音识别一般是一段录音整体识别，识别率不高，且不能区分对话双方。

发明内容

本发明要解决的技术问题是为了克服现有技术中语音识别率不高且不能区分对话双方的缺陷，提供一种语音对话的处理方法、系统、设备和存储介质。

本发明是通过下述技术方案来解决上述技术问题：

本发明提供一种语音对话的处理方法，该处理方法包括如下步骤：

将语音对话双方的媒体流录制在不同声道，生成一录音文件；

将所述录音文件拆分成左声道录音文件和右声道录音文件；

对所述左声道录音文件和所述右声道录音文件分别进行切片处理，生成若干个包含第一开始时间的左声道录音切片文件和若干个包含第二开始时间的右声道录音切片文件；

对若干个所述左声道录音切片文件和若干个所述右声道录音切片文件分别进行语音识别，生成若干个包含所述第一开始时间的左声道切片文本和若干个包含所述第二开始时间的右声道切片文本；