[发明专利]语音通话方法、装置、计算机设备及存储介质有效

申请号：	202110603109.4	申请日：	2021-05-31
公开（公告）号：	CN113223533B	公开（公告）日：	2023-06-06
发明（设计）人：	蒙桂;彭钊	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L17/00;G10L17/04;H04N7/14;H04N5/265
代理公司：	深圳市赛恩倍吉知识产权代理有限公司 44334	代理人：	刘丽华
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音通话方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及人工智能技术领域，提供一种语音通话方法、装置、计算机设备及存储介质，包括：获取第一用户阅读预设文本的阅读音频，调用声纹提取模型提取所述阅读音频中的所述第一用户的用户声纹及声纹提取参数；根据声纹提取参数提取双录视频中第一用户的通话音频；语音识别通话音频得到通话文本，对通话文本进行文本切分得到多个通话文本片段；从双录视频中切分出与每个通话文本片段对应的通话视频片段；将每个通话文本片段叠加显示在对应的通话视频片段上以辅助第二用户进行语音通话，根据双录视频的采集参数对显示在通话视频片段上的通话文本进行缩放处理。本发明能够辅助语音通话，提高语音通话的质量。

技术领域

本发明涉及人工智能技术领域，具体涉及一种语音通话方法、装置、计算机设备及存储介质。

背景技术

远程视频服务为用户的业务办理提供了很多便利，使用户“足不出户”成为了可能。另一方面，也在一定程度上取代了传统网点，降低了网点装修、场地开销、服务人员分散难管理等实际操作问题带来的成本。

远程视频服务需要高质量的语音通话，但受限于用户所处的环境等因素的影响，难免会出现周围环境噪声过大，导致用户无法清晰的听到客服的说话声，或客服无法清晰的听到用户的说话声，在嘈杂环境中通话时的通话质量很低，使客服与用户的沟通交流受到影响，用户体验十分不好，也一定程度上增加了沟通成本。

发明内容

鉴于以上内容，有必要提出一种语音通话方法、装置、计算机设备及存储介质，能够提高语音通话的质量，提升用户体验。

本发明的第一方面提供一种语音通话方法，所述方法包括：

获取第一用户阅读预设文本的阅读音频，并调用声纹提取模型提取所述阅读音频中的所述第一用户的用户声纹及声纹提取参数；

采集所述第一用户的双录视频，并根据所述声纹提取参数从所述双录视频中提取所述第一用户的通话音频；

对所述通话音频进行语音识别得到通话文本，并对所述通话文本进行文本切分得到多个通话文本片段；

从所述双录视频中切分出与每个通话文本片段对应的通话视频片段；