[发明专利]一种词库生成方法及装置在审
申请号: | 201611229448.6 | 申请日: | 2016-12-27 |
公开(公告)号: | CN106776573A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 郭红艳;李博;张淑燕 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京派特恩知识产权代理有限公司11270 | 代理人: | 张颖玲,李梅香 |
地址: | 518000 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种词库生成方法,能够降低维护词库的工作量,提高词库的准确性,该方法包括当预设时间段到达时,获取至少一个待分词文档;按照第一预设划分策略,将至少一个待分词文档划分成至少一个第一字符串集合,其中,一个待分词文档对应一个第一字符串集合;根据预设内聚模型和预设比较策略,确定与至少一个第一字符串集合中每个第一字符串集合对应的第一词语集合,得到至少一个第一词语集合;根据至少一个第一词语集合,确定第一词库。 | ||
搜索关键词: | 一种 词库 生成 方法 装置 | ||
【主权项】:
一种词库生成方法,其特征在于,包括:当预设时间段到达时,获取至少一个待分词文档;按照第一预设划分策略,将所述至少一个待分词文档划分成至少一个第一字符串集合,其中,一个待分词文档对应一个第一字符串集合;根据预设内聚模型和预设比较策略,确定与所述至少一个第一字符串集合中每个第一字符串集合对应的第一词语集合,得到至少一个第一词语集合;根据所述至少一个第一词语集合,确定第一词库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611229448.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种人称识别方法
- 下一篇:用户评论文本挖掘方法及装置