[发明专利]一种基于用户输入场景动态加载语言模型的方法及装置在审
申请号: | 201210276985.1 | 申请日: | 2012-08-06 |
公开(公告)号: | CN103577386A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | 肖镜辉;李鑫;刘廷超;汤利华 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/20 | 分类号: | G06F17/20 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 518057 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 输入 场景 动态 加载 语言 模型 方法 装置 | ||
1.一种基于用户输入场景动态加载语言模型的方法,包括:
判断当前的用户输入场景;
根据所述用户输入场景,选择对应的场景语言模型;
将所述场景语言模型与通用语言模型融合成混合语言模型;以及
加载所述混合语言模型对用户输入进行处理;
其中,所述场景语言模型和通用语言模型是通过训练得到的。
2.根据权利要求1所述的方法,其中,所述判断当前的用户输入场景的步骤还包括:
根据典型场景列表和用户输入环境上下文,判断当前的用户输入场景,其中,所述典型场景列表是通过对用户输入法宿主软件和/或用户输入信息进行分类统计得到的,所述用户输入环境上下文包括用户输入信息和/或输入法宿主软件信息。
3.根据权利要求1所述的方法,还包括:
根据场景训练语料生成针对用户输入场景的场景词表;根据所述场景训练语料和所述场景词表,用最大似然估计法训练出场景语言模型。
4.根据权利要求3所述的方法,其中,所述根据场景训练语料生成针对用户输入场景的场景词表的步骤包括:
根据典型场景列表对场景训练语料进行分类;
分别从分类后的各场景训练语料中抽取出对应的场景备选词表;以及
根据所述场景备选词表与通用词表得出所述场景词表。
5.根据权利要求1所述的方法,所述将所述场景语言模型与通用语言模型融合成混合语言模型的步骤包括:
用线性插值的方式将所述场景语言模型与通用语言模型融合成混合语言模型,插值系数用于调节所述场景语言模型和通用语言模型在所述混合语言模型中的比重。
6.根据权利要求1所述的方法,其中,所述语言模型是Ngram模型,所述场景语言模型是Bigram模型或Unigram模型。
7.一种基于用户输入场景动态加载语言模型的装置,包括:
输入场景判断模块,用于判断当前的用户输入场景;
场景语言模型选择模块,用于根据所述用户输入场景,选择对应的场景语言模型;
语言模型融合模块,用于将所述场景语言模型与通用语言模型融合成混合语言模型;以及
用户输入处理模块,用于加载所述混合语言模型对用户输入进行处理;以及
语言模型训练模块,用于训练出所述场景语言模型和所述通用语言模型。
8.根据权利要求7所述的装置,其中,所述输入场景判断模块包括:
用于根据典型场景列表和/或用户输入环境上下文,判断当前的用户输入场景的模块,其中,所述典型场景列表是通过对用户输入法宿主软件和/或用户输入信息进行分类统计得到的,所述用户输入环境上下文包括用户输入信息和/或输入法宿主软件信息。
9.根据权利要求7所述的装置,还包括:
场景词表生成模块,用于根据场景训练语料生成针对用户输入场景的场景词表,所述语言模型训练模块包括场景语言模型训练模块,用于根据所述场景训练语料和所述场景词表,用最大似然估计法训练出场景语言模型。
10.根据权利要求9所述的装置,其中,所述场景词表生成模块包括:
语料分类模块,用于根据所述典型场景列表对场景训练语料进行分类;
词表抽取模块,用于分别从分类后的各场景训练语料中抽取出对应的场景备选词表;以及
词表计算模块,用于根据所述场景备选词表与通用词表计算出所述场景词表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210276985.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无旁瓣角度选择激光滤波器
- 下一篇:试件表面上制备光栅的方法