[发明专利]语音识别方法和设备在审
申请号: | 201711372384.X | 申请日: | 2017-12-19 |
公开(公告)号: | CN108364651A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 文珉暎;李镐式;崔荣相 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/08;G10L15/183 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 张川绪;王兆赓 |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 方法和设备 候选文本 解码条件 目标文本数据 解码 语音信号 讲话 | ||
公开一种语音识别方法和设备。一种语音识别方法包括:从用户的语音信号产生多条候选文本数据;确定与用户的讲话类型对应的解码条件;通过基于确定的解码条件执行解码,在所述多条候选文本数据之中确定目标文本数据。
本申请要求于2017年1月26日提交到韩国知识产权局的第10-2017-0012354号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
以下描述涉及一种语音识别方法和设备。
背景技术
语音识别是用于识别用户的声音或语音的技术。用户的语音可通过语音识别被转换成文本。在语音识别中,识别语音的准确度受各种因素的影响,例如,用户发出语音所处的周围环境以及用户的当前状态。
发明内容
提供本发明内容以采用简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不旨在标识所要求的主题的关键特征或必要特征,本发明内容也不意图用于帮助确定所要求的主题的范围。
在一个总的方面,一种语音识别方法包括:从用户的语音信号产生多条候选文本数据;确定与用户的讲话类型对应的解码条件;通过基于确定的解码条件执行解码,在所述多条候选文本数据之中确定目标文本数据。
所述语音识别方法还可包括:基于语音信号的特征、上下文信息、以及来自语音信号的识别部分的语音识别结果中的任意一个或者任意两个或更多个的任意组合,确定讲话类型。
上下文信息可包括用户位置信息、用户配置文件信息以及在用户装置中执行的应用的应用类型信息中的任意一个或者任意两个或更多个的任意组合。
确定解码条件的步骤可包括:响应于讲话类型被确定,从映射信息选择映射到确定的讲话类型的解码条件,其中,映射信息包括多个讲话类型和分别映射到所述多个讲话类型的相应的多个解码条件。
确定目标文本数据的步骤可包括:将当前解码条件改变为确定的解码条件;基于确定的解码条件计算所述多条候选文本数据中的每个的概率;基于计算的多个概率,在所述多条候选文本数据之中确定目标文本数据。
确定目标文本数据的步骤可包括:基于确定的解码条件,调节声学模型的权重和语言模型的权重中的任何一个或两者;通过基于声学模型的权重和语言模型的权重中的任何一个或两者执行解码,来确定目标文本数据。
产生多条候选文本数据的步骤可包括:基于声学模型从语音信号确定音素序列;基于语言模型从确定的音素序列识别多个单词;基于识别的多个单词产生所述多条候选文本数据。
声学模型可包括被配置为基于语音信号的特征确定讲话类型的分类器。
解码条件可包括:声学模型的权重、语言模型的权重、与对音标分布的依赖性关联的比例因子、倒谱均值和方差标准化(CMVN)、以及解码窗口大小中的任意一个或者任意两个或更多个的任意组合。
在另一总的方面,一种存储指令的非暂时性计算机可读介质,当由处理器执行所述指令时,使处理器执行如上所述方法。
在另一总的方面,一种语音识别设备包括:处理器;存储器,被配置为存储可被处理器执行的指令;其中,响应于执行所述指令,处理器被配置为:从用户的语音信号产生多条候选文本数据;确定与用户的讲话类型对应的解码条件;通过基于确定的解码条件执行解码,在所述多条候选文本数据之中确定目标文本数据。
处理器还可被配置为:基于语音信号的特征、上下文信息、以及来自语音信号的识别部分的语音识别结果中的任意一个或者任意两个或更多个的任意组合,确定讲话类型。
上下文信息可包括用户位置信息、用户配置文件信息以及在用户装置中执行的应用的应用类型信息中的任意一个或者任意两个或更多个的任意组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711372384.X/2.html,转载请声明来源钻瓜专利网。