[发明专利]用于数据输入的语音识别和训练在审
申请号: | 202180022530.4 | 申请日: | 2021-02-23 |
公开(公告)号: | CN115298736A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | M·诺埃尔;A·弗里德;V·波瓦尔;S·M·基尔蒙 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘都;于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数据 输入 语音 识别 训练 | ||
用于识别和训练以识别字母数字语音数据输入的方法、系统和计算机程序产品。方法可包括基于预定规则将数据输入分割成顺序的n‑gram块,其中,通过语音识别接收数据输入。方法还可包括接收关于数据输入的特性的元数据。方法还可包括基于元数据生成语言模型。方法还可包括生成数据输入的第一组语言模型变体。方法还可包括基于至少第一组语言模型变体来训练语言模型。方法还可包括使用经训练的语言模型生成用于数据输入的一个或多个替代。方法还可包括发送包括数据输入的一个或多个替代的输出。
技术领域
本公开涉及语音到文本技术,并且更具体地,涉及训练系统以识别语音到文本系统中的字母数字语音数据输入。
背景技术
随着技术能力的增加,越来越多地利用语音到文本能力。例如,当用户呼叫帮助台、服务等时,用户通常必须给出账号、社会保险号、生日、密码等。用户可以使用语音来输入所需数据(例如,通过电话用声音输入数据)。语音识别技术可用于确定经由语音输入的内容,并将该输入转变或转换为计算机系统可识别和处理的文本。
可以在各种不同的使用情况下使用语音识别技术。这些使用情况可能需要语音识别来处理和识别多种类型的话语。例如,常规语音识别使用情况包括使用(来自用户的)一般话语来识别意图和实体。常规语音识别基础模型可用于识别常用的单词和句子,并将它们转换成文本。例如,可识别“我的名字是John Doe”的一般话语并且通过常规语音识别模型将其转换成文本。
然而,常规语音识别技术可能具有更复杂话语的困难。例如,对于语音识别技术来说,识别诸如ID、日期或其他字母数字数据输入的数据输入可能是有挑战性的,并且常规语音识别技术在识别字母数字输入时可能不是非常准确的。字母数字数据输入可以是包括字母/单词和数字两者的数据输入。例如,可能难以使用常规语音识别技术来识别“my dateof birth is January 8,1974(我的出生日期是1974年1月8日)”的字母数字话语,这是由于话语中存在单词和数字的组合。常规语音识别可能不区分“8”与“h”;不区分“f”与“s”;不区分“d”与“t”;不区分“m”与“n”;不区分“4”与单词“for”;不区分“to”与“too”与数字“2”等。因此,继续先前的示例,常规语音识别可将上述语音输入转换成诸如“my date ofbirth is January H 1970 For(我的出生日期是1970年1月H日For)”的文本,该文本是不准确的。
因此,需要解决本领域中的上述问题。
发明内容
从第一方面来看,本发明提供了计算机实现的方法,包括:基于预定规则将数据输入分割成顺序的n-gram块,其中,通过语音识别接收所述数据输入;接收关于数据输入的特性的元数据;基于元数据生成语言模型;生成数据输入的第一组语言模型变体;至少基于第一组语言模型变体来训练语言模型;使用经训练的语言模型生成数据输入的一个或多个替代;以及发送包括数据输入的一个或多个替代的输出。
从另一个方面来看,本发明提供了具有一个或多个计算机处理器的系统,该系统被配置为:基于预定规则将输入数据分割为顺序的n-gram块,其中,数据输入是语音到文本转录;接收关于数据输入的特性的元数据;基于元数据生成语言模型;生成数据输入的第一组语言模型变体;至少基于第一组语言模型变体来训练语言模型;使用经训练的语言模型生成数据输入的一个或多个替代;以及发送包括数据输入的一个或多个替代的输出。
从另一方面来看,本发明提供了用于识别语音到文本系统中的字母数字语音数据输入的计算机程序产品,该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质可由处理电路读取并且存储用于由该处理电路执行以便执行用于执行本发明的步骤的方法的指令。
从另一方面来看,本发明提供存储在计算机可读介质上并且可加载到数字计算机的内部存储器中的计算机程序,该计算机程序包括当程序在计算机上运行时用于执行本发明的步骤的软件代码部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180022530.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:线束
- 下一篇:检查晶片期间静电卡盘的动态控制方法、装置和系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置