[发明专利]对输入法所产生的候选项进行排序的方法及装置有效

专利信息
申请号: 201210531877.4 申请日: 2012-12-11
公开(公告)号: CN103869999B 公开(公告)日: 2018-10-16
发明(设计)人: 吴先超 申请(专利权)人: 百度国际科技(深圳)有限公司
主分类号: G06F3/023 分类号: G06F3/023;G06F17/30
代理公司: 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人: 袁媛
地址: 518057 广东省深圳市南山*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 输入法 产生 候选 进行 排序 方法 装置
【权利要求书】:

1.一种对输入法所产生的候选项进行排序的方法,其特征在于,包括:

利用所述输入法接收当前用户的当前输入信息;

根据已建立的与领域相关的L个不同的语言模型,获取所述当前用户当前输入信息的候选项集合中每个候选项所属的领域,其中,L是自然数;

按照所述每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序,其中,通过以下方式获得所述当前用户所属的领域集合:获取当前用户的输入历史信息;根据所述当前用户的输入历史信息,用所述已建立的与领域相关的L个不同的语言模型对当前用户进行分类,获得当前用户所属的领域集合;

展示进行所述排序后的候选项。

2.根据权利要求1所述的方法,其特征在于,所述根据已建立的与领域相关的L个不同的语言模型,获取所述当前用户当前输入信息的候选项集合中每个候选项所属的领域的步骤之前,包括:

使用文本分类技术,对网页语料进行分类整理,获得L个不同的领域和L类不同的与领域相关的网页语料;

将所述L类不同的与领域相关的网页语料,分别按照各自的领域训练出L个不同的与领域相关的语言模型。

3.根据权利要求2所述的方法,其特征在于,所述按照所述每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序的步骤之前,包括:

获取多个用户的输入历史信息,所述多个用户属于所述L个不同的领域;

从所述获取的多个用户的输入历史信息中选取部分输入历史信息;

对所述选取的部分输入历史信息进行标注,获得多个用户标注的训练语料;

将所述多个用户标注的训练语料和所述L类不同的与领域相关的网页语料,用半督导机器学习方法分别按照各自的领域训练出与领域相关的用户分类器;

根据已获得的所述当前用户的输入历史信息,用所述与领域相关的用户分类器对当前用户进行分类,获得当前用户所属的领域集合。

4.根据权利要求3所述的方法,其特征在于,所述输入历史信息包括在输入法应用中的输入历史信息、在即时通信工具中的输入历史信息以及在社交网站中的输入历史信息。

5.根据权利要求1所述的方法,其特征在于,所述按照每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序的步骤,包括:

根据所述每个候选项所属的领域与已获得的所述当前用户所属的领域集合中的领域的相关性的大小,获得当前用户当前输入信息的候选项集合中每个候选项的权重;

根据所述候选项集合中每个候选项的权重的大小,对当前用户当前输入信息的候选项集合中的候选项进行排序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度国际科技(深圳)有限公司,未经百度国际科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210531877.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top