[发明专利]一种信息处理方法及电子设备有效
| 申请号: | 201410299742.9 | 申请日: | 2014-06-26 |
| 公开(公告)号: | CN105446977B | 公开(公告)日: | 2019-03-29 |
| 发明(设计)人: | 葛付江;苗振兴;贾鹏程;赵凯;卓雷 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36 |
| 代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 黄威;王智 |
| 地址: | 100085 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息处理 方法 电子设备 | ||
本发明涉及计算机领域,公开了一种信息处理方法及电子设备,以解决现有技术中对特定用户群体的群体特征词汇更新速度慢的技术问题,该方法应用于电子设备中,包括:获得电子设备的用户的N个特征词汇,N为正整数;判断N个特征词汇中的任一特征词汇是否为用户所在特定用户群体的群体特征词汇,进而从N个特征词汇中确定出M个群体特征词汇,其中,群体特征词汇为特定用户群体中的至少两个用户的特征词汇,M为小于等于N的正整数;通过M个群体特征词汇对电子设备的用户词典进行更新。
技术领域
本发明涉及计算机领域,特别涉及一种信息处理方法及电子设备。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的电子设备,享受随着科技发展带来的舒适生活。
而在电子设备的应用中,汉字输入法已经成为用户与电子设备交互的重要手段,汉字输入法技术需要将用户的一连串键盘按键翻译成用户想要的汉字串,通常汉字输入法都需要具备用户词典,用于存储用户最可能会使用的汉字、词语和短语,而通常情况下,特定用户群体中多个用户可能会有相同的特征词汇,该词即为群体特征词汇,现有技术中都需要通过服务器来确定特定用户群体的群体特征词汇,例如:服务器端从互联网上收集整理,然后下发给输入法客户端;又例如:服务器端收集输入法客户端用户的输入词汇及其词频然后进行统计,再下发给输入法客户端等等。然而,这两种方式都需要服务器端通过较长的周期收集整理用户的特征词汇,故而现有技术中存在着对特定用户群体的群体特征词汇更新速度慢的技术问题。
发明内容
本发明实施例提供一种信息处理方法及电子设备,以解决现有技术中对特定用户群体的群体特征词汇更新速度慢的技术问题。
第一方面,本发明实施例提供一种信息处理方法,应用于电子设备中,包括:获得所述电子设备的用户的N个特征词汇,N为正整数;判断所述N个特征词汇中的任一特征词汇是否为所述用户所在特定用户群体的群体特征词汇,进而从所述N个特征词汇中确定出M个群体特征词汇,其中,所述群体特征词汇为所述特定用户群体中的至少两个用户的特征词汇,M为小于等于N的正整数;通过所述M个群体特征词汇对所述电子设备的用户词典进行更新。
结合第一方面,在第一种可能的实现方式中,所述判断所述特征词汇中的任一特征词汇是否为所述用户所在特定用户群体的群体特征词汇,具体包括:依次取i为1至N的整数,确定所述N个特征词汇中第i个特征词汇的第i传播跳数和第i共现跳数,所述第i传播跳数具体为:所述第i个特征词汇从第一次出现到传输至所述电子设备所经过的节点数量,所述第i共现跳数具体为:在所述第i个特征词汇的传播过程中,将所述第i个特征词汇作为特征词汇的节点数量;判断所述第i共现跳数除以所述第i传播跳数的商值是否大于第一预设阈值;在所述商值大于所述第一预设阈值时,则确定所述第i个特征词汇为所述群体特征词汇。
结合第一方面,在第二种可能的实现方式中,所述获得所述电子设备的用户的N个特征词汇,具体为:获得所述电子设备的用户使用频率超过第二预设阈值的词汇作为所述N个特征词汇;或接收另一电子设备发送至所述N个特征词汇;或获得所述电子设备的用户的使用频率超过第二预设阈值的N1个词汇,以及接收另一电子设备的发送至的N2个特征词汇,所述N1个词汇与所述N2个特征词汇组成所述N个特征词汇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410299742.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成数据格式描述语言模型的方法和装置
- 下一篇:一种自适应的分词方法





