[发明专利]一种建立语言模型的方法、语音识别的方法及其装置有效
申请号: | 201210050076.6 | 申请日: | 2012-02-29 |
公开(公告)号: | CN102623010A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 万广鲁 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 建立 语言 模型 方法 语音 识别 及其 装置 | ||
1.一种建立语言模型的方法,其特征在于,所述方法包括:
获取时效性搜索语料;
利用获取到的时效性搜索语料进行语言模型训练,以得到时效性语言模型;
将所述时效性语言模型与背景语言模型融合,以得到最终的识别语言模型,其中所述背景语言模型用于描述用户的长期检索行为。
2.根据权利要求1所述的方法,其特征在于,所述背景语言模型为已有的识别语言模型。
3.根据权利要求1所述的方法,其特征在于,获取时效性搜索语料的步骤包括:
从搜索引擎服务器上获取最近的设定时间长度内的检索日志并将获取的检索日志作为时效性搜索语料;或者,
将在最近的设定时间长度内对用户的语音搜索查询的识别结果作为时效性搜索语料。
4.根据权利要求1所述的方法,其特征在于,在将所述时效性语言模型与所述背景语言模型融合时,将所述时效性语言模型中的参数与所述背景语言模型中的参数进行插值,以得到所述识别语言模型中的参数,其中所述参数为各N元词组N-Gram的概率值。
5.根据权利要求4所述的方法,其特征在于,将所述时效性语言模型中的参数与所述背景语言模型中的参数进行插值时,对所述时效性语言模型中的参数进行加权。
6.一种语音识别的方法,其特征在于,所述方法包括:
获取用户的语音搜索查询;
使用权利要求1至5中任一权项所述建立语言模型的方法建立的识别语言模型对用户的语音搜索查询进行识别,得到识别结果。
7.根据权利要求6所述的方法,其特征在于,所述方法进一步包括:
向用户返回与所述识别结果相关的检索结果。
8.根据权利要求6所述的方法,其特征在于,对用户的语音搜索查询进行识别的步骤包括:
利用声学模型将用户的语音搜索查询转化为相应的音节序列;
获取与所述音节序列对应的一个以上的候选词序列;
使用所述识别语言模型计算每个候选词序列在所述识别语言模型中出现的概率,并选择出现概率最大的候选词序列作为对用户的语音搜索查询的识别结果。
9.一种建立语言模型的装置,其特征在于,所述装置包括:
获取单元,用于获取时效性搜索语料;
训练单元,用于利用获取到的时效性搜索语料进行语言模型训练,以得到时效性语言模型;
融合单元,用于将所述时效性语言模型与背景语言模型融合,以得到最终的识别语言模型,其中背景语言模型用于描述用户的长期检索行为。
10.根据权利要求9所述的装置,其特征在于,所述背景语言模型为已有的识别语言模型。
11.根据权利要求9所述的装置,其特征在于,所述获取单元获取时效性搜索语料时,从搜索引擎服务器上获取在最近的设定时间长度内的检索日志并将获取的检索日志作为时效性搜索语料;或者,将在最近的设定时间长度内对用户的语音搜索查询的识别结果作为时效性搜索语料。
12.根据权利要求9所述的装置,其特征在于,所述融合单元在将所述时效性语言模型与所述背景语言模型融合时,将所述时效性语言模型中的参数与所述背景语言模型中的参数进行插值,以得到所述识别语言模型中的参数,其中所述参数为各N元词组N-Gram的概率值。
13.根据权利要求12所述的装置,其特征在于,所述融合单元在将所述时效性语言模型中的参数与所述背景语言模型中的参数进行插值时,对所述时效性语言模型中的参数进行加权。
14.一种语音识别的装置,其特征在于,所述装置包括:
接收单元,用于获取用户的语音搜索查询;
识别单元,用于使用权利要求9至13中任一权项所述建立语言模型的装置建立的识别语言模型对用户的语音搜索查询进行识别,得到识别结果。
15.根据权利要求14所述的装置,其特征在于,所述装置进一步包括:
检索单元,用于向用户返回与所述识别结果相关的检索结果。
16.根据权利要求14所述的装置,其特征在于,所述识别单元包括:
转化单元,用于利用声学模型将用户的语音搜索查询转化为相应的音节序列;
词序列单元,用于获取与所述音节序列对应的一个以上的候选词序列;
计算单元,用于使用所述识别语言模型计算每个候选词序列在所述识别语言模型中出现的概率,并选择出现概率最大的候选词序列作为对用户的语音搜索查询的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210050076.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种利用黑匣子获取崩溃信息的方法、黑匣子及服务器
- 下一篇:受控的种子润湿