[发明专利]对输入法所产生的候选项进行排序的方法及装置有效
申请号: | 201210531877.4 | 申请日: | 2012-12-11 |
公开(公告)号: | CN103869999B | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 吴先超 | 申请(专利权)人: | 百度国际科技(深圳)有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入法 产生 候选 进行 排序 方法 装置 | ||
1.一种对输入法所产生的候选项进行排序的方法,其特征在于,包括:
利用所述输入法接收当前用户的当前输入信息;
根据已建立的与领域相关的L个不同的语言模型,获取所述当前用户当前输入信息的候选项集合中每个候选项所属的领域,其中,L是自然数;
按照所述每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序,其中,通过以下方式获得所述当前用户所属的领域集合:获取当前用户的输入历史信息;根据所述当前用户的输入历史信息,用所述已建立的与领域相关的L个不同的语言模型对当前用户进行分类,获得当前用户所属的领域集合;
展示进行所述排序后的候选项。
2.根据权利要求1所述的方法,其特征在于,所述根据已建立的与领域相关的L个不同的语言模型,获取所述当前用户当前输入信息的候选项集合中每个候选项所属的领域的步骤之前,包括:
使用文本分类技术,对网页语料进行分类整理,获得L个不同的领域和L类不同的与领域相关的网页语料;
将所述L类不同的与领域相关的网页语料,分别按照各自的领域训练出L个不同的与领域相关的语言模型。
3.根据权利要求2所述的方法,其特征在于,所述按照所述每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序的步骤之前,包括:
获取多个用户的输入历史信息,所述多个用户属于所述L个不同的领域;
从所述获取的多个用户的输入历史信息中选取部分输入历史信息;
对所述选取的部分输入历史信息进行标注,获得多个用户标注的训练语料;
将所述多个用户标注的训练语料和所述L类不同的与领域相关的网页语料,用半督导机器学习方法分别按照各自的领域训练出与领域相关的用户分类器;
根据已获得的所述当前用户的输入历史信息,用所述与领域相关的用户分类器对当前用户进行分类,获得当前用户所属的领域集合。
4.根据权利要求3所述的方法,其特征在于,所述输入历史信息包括在输入法应用中的输入历史信息、在即时通信工具中的输入历史信息以及在社交网站中的输入历史信息。
5.根据权利要求1所述的方法,其特征在于,所述按照每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序的步骤,包括:
根据所述每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,获得当前用户当前输入信息的候选项集合中每个候选项的权重;
根据所述候选项集合中每个候选项的权重的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度国际科技(深圳)有限公司,未经百度国际科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210531877.4/1.html,转载请声明来源钻瓜专利网。