[发明专利]实时庭审语音识别自动纠错方法、存储介质及计算装置有效
| 申请号: | 201810778161.1 | 申请日: | 2018-07-16 |
| 公开(公告)号: | CN108984529B | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 邓承超 | 申请(专利权)人: | 北京华宇信息技术有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/284;G10L15/06;G10L15/08;G10L15/18;G10L15/26 |
| 代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰 |
| 地址: | 100084 北京市海淀区中关村*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实时 庭审 语音 识别 自动 纠错 方法 存储 介质 计算 装置 | ||
提供了一种计算机执行的实时庭审语音识别自动纠错方法、计算机可读存储介质和计算装置,该方法包括:实时响应于检测到庭审系统中用户对语音识别出的文字进行的修改操作,发现热词并添加到热词库中;实时对庭审语音进行识别;以及实时对识别出的文字进行热词匹配操作,以及进行热词替换。根据本发明实施例的庭审语音识别系统运行过程中实时地自动地发现热词以及构建并更新热词库,从而实现了庭审系统的自学习功能;通过在热词存储和热词替换上使用ts_code技术,通过模糊音配置可针对不同的口音,自动生成不同的设置,从而能够简捷高效地实现多种地方口音导致语音识别错误的纠正问题。
技术领域
本发明总体地涉及法庭上的语音识别技术,特别是涉及计算机执行的实时庭审语音识别自动纠错方法、存储介质和计算装置。
背景技术
随着人工智能的技术性突破,越来越多与人工智能相关的产品被应用在人们的生活当中,庭审语音识别系统便是在法律工作者行业中的一项应用,这其中涉及到自然语音处理和语音识别技术的混合应用。
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语音处理涉及自动分词、词性标注、句法分析、自然语音生成等技术。
语音识别技术,也被称为自动语音识别Automatic Speech Recognition, (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。通过语音识别引擎,能够将庭审过程中所有相关人员的语音转换为计算机可显示的文本文字。
总的来说,通过语音识别技术,能够极大的解放庭审书记员的工作量,但是对于机器,乃至人来说,一个人、一个机构、一个公司的名字,具体是哪几个汉字,如果没有提前告知,是无法知道的。这导致每次通过语音识别得到文本后,书记员不得不又重新梳理文章,将庭审记录中所有的出现名字的地方重新替换为正确的人名,这无疑增加了书记员的工作量。
目前一些语音识别引擎有相关热词功能,通常是用户事先将可能会识别错误的词发送给语音识别引擎,引擎分析这几个词的发音和音频。最后将这几个词的热词模型更新在语音识别模型中。目前大多数语音识别引擎的热词都是通过这种方法实现。
现有技术具有下面的一个或多个缺点:
(1)需要用户手动设置热词,增加用户工作量;
(2)具有一定的延迟性,热词需要等待一等时间才能生效;
(3)无法解决地方性方言问题,如果用户只是某些词发音不准,那么现有技术方案会完全失效;
(4)热词数量有一定的限制,如果热词设置过量,可能会打破语音识别引擎的原本的模型,因此现有语音识别引擎对热词的设置对热词长度和数量都有一定限制;
(5)无法自动排版,比如在识别到中华人民共和国合同法的时候,无法自动添加标点符号。
法庭庭审系统需要能更好地识别热词以及进行语音纠错的技术。
发明内容
鉴于上述情况,提出了本发明。
根据本发明的一个方面,提供了一种计算机执行的实时庭审语音识别自动纠错方法,包括:实时响应于检测到庭审系统中用户对语音识别出的文字进行的修改操作,发现热词并添加到热词库中;实时对庭审语音进行识别;以及实时对识别出的文字进行热词匹配操作,以及进行热词替换。
可选地,发现热词并添加到热词库中可以包括:基于语音识别的文本以及基于庭审系统中用户对该语音识别结果进行的修改返回的文本,利用自然语言处理技术对语音识别的文本进行分词和词性分析;确定被修改的词汇,以及判断所述词汇的词性是否符合预定标准;在确定被修改的词汇的词性符合预定标准时,将修改后的词汇加入热词列表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华宇信息技术有限公司,未经北京华宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810778161.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于思维距离的社交方法
- 下一篇:一种网络敏感内容的检测方法及检测系统





