[发明专利]基于在线会议的沟通辅助方法、装置、设备及介质在审
申请号: | 202011510029.6 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112542172A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 李健 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/32;G10L15/30 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 杨毅玲;刘丽华 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 在线 会议 沟通 辅助 方法 装置 设备 介质 | ||
本发明涉及人工智能领域,提供一种基于在线会议的沟通辅助方法、装置、设备及介质,能够首先最大限度地通过本地模型进行语音识别转文字,具有流畅性和安全性,进一步将识别的不够准确或者识别率不高的音频筛选出来进行二次识别,以保证语音识别的效果更佳,具有兜底的可靠性,拼接所述第一文字序列及所述第二文字序列,得到目标文本,实时显示所述目标文本,以便基于人工智能手段实现对在线会议的辅助沟通。此外,本发明还涉及区块链技术,本地语音识别模型及目标语音识别模型可存储于区块链节点中。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于在线会议的沟通辅助方法、装置、设备及介质。
背景技术
很多服务网点(如银行服务网点)的洽谈室内都设有多个电视大屏,可以由网点工作人员(如理财经理)呼叫其他人(如远程投资顾问)给客户提供更专业的服务(如投资服务),并进行多方的在线音视频通话。
而在目前的在线会议中,通常还存在如下弊端:
1.常规的音视频会议没有进行实时的音频转文字,对听力较弱的用户,及在接听方不方便开较大音量的场景下,体验不佳。
2.常规使用公网语音云进行实时语音转文字,语音流需要实时上传至公网服务器解析成文字再回传至本地,需要频繁地与第三方网络请求交互,不仅容易卡顿,且存在一定的风险泄露问题,频繁的网络请求也容易使字幕显示延迟。
发明内容
鉴于以上内容,有必要提供一种基于在线会议的沟通辅助方法、装置、设备及介质,能够首先最大限度地通过本地模型进行语音识别转文字,具有流畅性和安全性,进一步将识别的不够准确或者识别率不高的音频筛选出来进行二次识别,以保证语音识别的效果更佳,具有兜底的可靠性,以基于人工智能手段实现对在线会议的辅助沟通。
一种基于在线会议的沟通辅助方法,所述基于在线会议的沟通辅助方法包括:
响应于沟通辅助指令,根据所述沟通辅助指令确定目标语音采集设备,并启动所述目标语音采集设备采集语音;
对采集的语音进行预处理,得到第一待识别音频;
将所述第一待识别音频输入至本地语音识别模型,得到本地识别结果;
从所述本地识别结果中获取匹配度及识别率;
根据所述匹配度及所述识别率将所述第一待识别音频拆分为已识别音频及第二待识别音频,并从所述本地识别结果中获取所述已识别音频对应的文字识别结果作为第一文字序列;
连接目标服务器,将所述第二待识别音频输入至所述目标服务器中的目标语音识别模型,并从所述目标语音识别模型的输出中获取文字识别结果作为第二文字序列;
拼接所述第一文字序列及所述第二文字序列,得到目标文本;
实时显示所述目标文本。
根据本发明优选实施例,所述根据所述沟通辅助指令确定目标语音采集设备包括:
解析所述沟通辅助指令的方法体,得到所述沟通辅助指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
利用所述正则表达式在所述沟通辅助指令所携带的信息中进行遍历,并将遍历到的数据确定为会议标识;
与所述会议标识对应的目标会议室建立连接,并获取所述目标会议室的语音采集设备作为所述目标语音采集设备;及/或
当检测到有终端设备远程连接至所述目标会议室时,将所述终端设备的语音采集设备确定为所述目标语音采集设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011510029.6/2.html,转载请声明来源钻瓜专利网。