[发明专利]一种多通道语音识别装置及其语音转文字方法在审

专利信息
申请号: 202210695916.8 申请日: 2022-06-20
公开(公告)号: CN115101051A 公开(公告)日: 2022-09-23
发明(设计)人: 胡劲松;冯思铭;杨皓晖;连泽涛;贺映玲 申请(专利权)人: 华南理工大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/08;G10L15/14
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 冯炳辉
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通道 语音 识别 装置 及其 转文 方法
【说明书】:

发明公开了一种多通道语音识别装置及其语音转文字方法,用于识别电力调度过程中的语音指令和对话。电力智能化调度需要3个语音识别功能:调度员通话语音识别、现场人员通话语音识别、调度员语音指令操作,因此有3个语音源输入,目前的做法是用多个语音识别装置,为避免装置之间的干扰,还需要人工频繁开关切换,本发明设计了一种单声卡三音源装置,用一个普通内置声卡的Mic接口和Line in接口,解决了上述三个语音源的识别,同时,本发明提出差频原理,自动建立本地电力差频专用词库,能识别本地电力部门的专用词汇。

技术领域

本发明涉及语音识别的技术领域,尤其是指一种多通道语音识别装置及其语音转文字方法。

背景技术

在电力调度过程中,使用语音识别技术,可以提高效率,进一步实现调度自动化和智能化。除了识别调度员发出的语音指令外,还需要识别调度员和现场人员之间的电话通话,把这些通话变为文本后存储起来可以实现调度日志的快速查询,进一步还可以实现更为高级的智能操作票功能。所以,电力调度系统需要实现三个语音识别功能:调度员指令识别、调度员通话识别、现场人员通话识别。当然,一个调度员不可能同时发出语音指令和打电话。目前普遍使用的方法是在一台电脑上用一个麦克风实现一个语音源的识别,通过开关进行切换语音指令和通话识别功能,这种方案有比较明显的缺点:

1、三个音源输入,都要麦克风,用开关切换极为不便;

2、因为只有一个语音识别装置和麦克风,为了识别电话对话,只能用免提外放,通过麦克风再输入识别,环境噪声太大,严重影响识别率;

3、因为只有一个语音识别装置,调度员和现场人员通话时必须保证:当一人说话时,另一人静默,否则无法语音识别;

以上方案也是目前智能音箱的语音识别方案,显然不适合电力调度系统。

此外,还有一个重要的技术问题要解决。电力调度中通常涉及大量的电力专业术语以及各个电力部门特有的地名、线路、电站、特定编号的设备名乃至人名,由于语言中大量同音词的存在,目前的语音识别技术往往把这些平时比较生僻的专用词汇识别成其它常见的普通词汇,因而错误率比较高,难以满足电力专业的需要。因此,造成以上问题的主要原因在于:目前的语音识别技术是基于频率优先匹配,当语音变为拼音之后,会优先匹配那些平时出现频率较高的通用词汇、热门词汇。

有些文献提出加入专用的词汇,但还是存在3个问题:

1、本地电力部门的专用词汇不会在通用的词汇库中出现,需要各个地区的电力部门根据自己部门的需要手工建立,要调度员在大量本地文本资料中逐个筛选专用词汇,此外,这些专用词汇还要不断更新、替换和统计刷新频率,费时费力,而调度部门平时责任重大,任务繁重,难以分身。

2、在词库中加入专用词汇和通用的热门词汇合一起,专用词汇出现频率较低,在拼音相同的情况下,仍然会优先热门词汇。

3、目前的匹配都是以一个拼音串的首字母为起点,向后逐个开始转换为文字,因为噪声的干扰和同音字的存在,后面重要的专用词汇的某些拼音可能和前面的拼音提前组合转换成了其它词组,导致错误。例如本来要XXX线路的刀闸合闸,结果变成了其它线路合闸,造成严重的后果。相反,普通词汇的错误相对可以接受。

发明内容

本发明的第一目的在于克服现有技术的缺点与不足,提供了一种多通道语音识别装置,可以准确识别电力调度语音指令、调度员和现场人员通话语音,其关键是如何用较小的代价实现三个语音源的识别,此外还需要解决电力调度中的专用词汇的识别,尤其是本地电力部门的专用词汇,例如本地特有的地名、线路、电站、特定设备名乃至人名。

本发明的第二目的在于提供一种多通道语音识别装置的语音转文字方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210695916.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top