[发明专利]一种输入法词库的处理方法和装置有效
申请号: | 201010206002.8 | 申请日: | 2010-06-23 |
公开(公告)号: | CN102298581B | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 刘致远 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/023 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 杨波 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 输入法 词库 处理 方法 装置 | ||
1.一种输入法词库的处理方法,其特征在于,包括:
获取第一用户终端组输入的搜索词汇信息;
根据所述搜索词汇信息生成专有词库;
将所述专有词库发送给第二用户终端组,以供第二用户终端组添加专有 词库;
其中,所述根据所述搜索词汇信息生成专有词库包括;
根据所述搜索词汇信息确定待选词;
根据所述待选词获取待选词集合;
根据所述待选词集合生成所述专有词库;
其中,所述根据所述待选词获取待选词集合,具体包括:
对所述待选词进行去重,并统计所述待选词的重复次数;
根据所述待选词的重复次数,确定每个待选词对应的权重,并根据待选 词与权重的对应关系建立待选词与对应权重的集合;
将所述集合中的待选词按照对应的权重进行排序,得到所述待选词集合。
2.如权利要求1所述的方法,其特征在于,所述获取第一用户终端组输 入的搜索词汇信息,具体包括:
从搜索引擎数据库中获取第一用户终端组输入的搜索词汇信息,其中, 所述搜索引擎数据库中存储了所述第一用户终端组在搜索引擎中输入的搜索 词汇信息。
3.如权利要求1所述的方法,其特征在于,根据所述待选词集合生成所 述专有词库,包括:
根据第一预设策略从所述待选词集合中选取预设个数的待选词;
根据选取的待选词生成所述专有词库。
4.如权利要求1所述的方法,其特征在于,根据所述待选词集合生成所 述专有词库,具体包括:
根据第二预设策略调整待选词集合,并当调整后的待选词达到预设数量 时,生成专有词库。
5.一种输入法词库的处理装置,其特征在于,包括:
获取模块,用于获取第一用户终端组输入的搜索词汇信息;
生成模块,用于根据所述获取模块获取的所述搜索词汇信息生成专有词 库;
发送模块,用于将所述生成模块生成的所述专有词库发送给第二用户终 端组,以供第二用户终端组添加专有词库;
所述生成模块包括:
确定子模块,用于根据所述搜索词汇信息确定待选词;
获取子模块,用于根据所述确定子模块确定的所述待选词获取待选词集 合;
生成子模块,用于根据所述获取子模块获取的所述待选词集合生成所述 专有词库;
所述获取子模块,具体用于对所述待选词进行去重,并统计所述待选词 的重复次数;根据所述待选词的重复次数,确定每个待选词对应的权重,并 根据待选词与权重的对应关系建立待选词与对应权重的集合;将所述集合中 的待选词按照对应的权重进行排序,得到所述待选词集合。
6.如权利要求5所述的装置,其特征在于,
获取模块,具体用于从搜索引擎数据库中获取第一用户终端组输入的搜 索词汇信息,其中,所述搜索引擎数据库中存储了所述第一用户终端组在搜 索引擎中输入的搜索词汇信息。
7.如权利要求5所述的装置,其特征在于,
所述生成子模块,具体用于根据第一预设策略从所述待选词集合中选取 预设个数的待选词;
根据选取的待选词生成所述专有词库。
8.如权利要求5所述的装置,其特征在于,
所述生成子模块,还用于根据第二预设策略调整待选词集合,并当调整 后的待选词达到预设数量时,生成专有词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010206002.8/1.html,转载请声明来源钻瓜专利网。