[发明专利]一种应用于多人混杂场景下的模糊语句识别方法及系统有效

专利信息
申请号: 202110467220.5 申请日: 2021-04-28
公开(公告)号: CN113223509B 公开(公告)日: 2022-06-10
发明(设计)人: 何克晶;李俊仪 申请(专利权)人: 华南理工大学
主分类号: G10L15/20 分类号: G10L15/20;G10L15/16;G10L15/06;G06F40/30;G06F16/63;G06N3/04
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍;江裕强
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 应用于 混杂 场景 模糊 语句 识别 方法 系统
【说明书】:

发明公开了一种应用于多人混杂场景下的模糊语句识别方法及系统,所述方法包括以下步骤:S1、实时采集语音信号并转化为模糊语句文本并进行预处理;S2、使用端到端拼音级文本纠错模型对所述模糊语句文本进行拼音级文本纠错,以获取拼音级无错文本;S3、对所述拼音级无错文本进行语义级文本错误检测,以获取出错字体的位置;S4、对文本进行语义级纠正,以获取到语义清晰的文本。本发明可以通过自动拼音级文本纠错、语义级文本纠错从模糊语句文本中恢复出语义清晰的文本,在多人混杂场景中更准确地识别出用户语句。

技术领域

本发明涉及人工智能技术领域,具体涉及一种应用于多人混杂场景下的模糊语句识别方法及系统。

背景技术

在自然语言处理中,模糊语句指的主要是含有同音或近音字、错误用字、多余字的语句,容易造成语言处理模型识别不清、无法处理的现象。目前的营业厅机器人客服往往处在一个多人同时说话的混杂场景中,导致机器人客服无法准确获取正在与之交互的用户想表达的信息,服务质量大大降低。因此,如何将模糊语句转化为语义准确的语句显得尤为重要。现有的解决方案大多在语音识别阶段提取用户语句或基于规则处理模糊语句文本,举例如下:

(1)将各种噪声估计方法结合如最小值跟踪噪声估计,MCRA,IMCRA等(熊晶,何兴,李晋升.基于大小窗双向并行最小值搜索的IMCRA算法[J].信息通信,2015,(3).53-55.),然后使用神经网络模型去除语音中的噪声。这种方法的缺点在于:当用户处在弱噪声环境下,去噪处理将不可避免的对语音有所损伤,只有在十分恶劣的环境下,才会起到非常明显的作用。

(2)使用声纹识别技术,通过分析不同用户的声纹以及声音强弱程度,从混杂语音中提取出用户的语音(林暧辉,张伟颂,徐毓文.浅议声纹鉴定中噪声对语音频谱特征的影响及降噪处理[J].黑龙江科技信息,2015,(36).129-130.)。采用此方法的缺点在于:在对用户声纹进行记录时可能会混入噪声,导致后续无法与用户的声纹进行匹配。

(3)请语言学专家制定一系列规则,然后使用规则对模糊语句文本进行分析、判定,最终得到语义准确的文本(张晴晴,潘接林.模糊发音字典在方言口音语音识别中的应用[C].//第八届全国人机语音通讯学术会议(NCMMSC8).:153-156.)。这种方法具有很大的局限性,语言专家无法穷举规则,当模糊语句无法与规则匹配时,就无法将其转化为语义准确的语句。

发明内容

本发明的目的在于提供一种应用于多人混杂场景下的模糊语句识别及系统,主要解决多人混杂场景下,环境中各种噪声、多人言语嘈杂导致模糊语句无法被正确识别的问题。本发明利用多层编码器充分学习拼音级的文本错误特征以及拼音和文本上下文之间的联系,对模糊语句文本进行拼音级文本纠错,提高了语义级错误检测的准确率。

本发明至少通过如下技术方案之一实现。

一种应用于多人混杂场景下的模糊语句识别方法,包括以下步骤:

S1、实时采集语音信号并转化为模糊语句文本并进行预处理;

S2、使用端到端拼音级文本纠错模型对所述模糊语句文本进行拼音级文本纠错,以获取拼音级无错文本;

S3、对所述拼音级无错文本进行语义级文本错误检测,以获取出错字体的位置;

S4、对文本进行语义级纠正,以获取到语义清晰的文本。

优选的,所述端到端拼音级文本纠错模型包括拼音纠错预训练模型和拼音转汉字预训练模型;所述拼音纠错预训练模型通过全连接层与所述拼音转汉字预训练模型相连,构成端到端拼音级文本纠错模型;

拼音纠错预训练模型和拼音转汉字预训练模型均包括拼音嵌入层和多个编码器;

所述拼音纠错预训练模型使用模糊音数据进行训练;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110467220.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top