[发明专利]提取关键字的方法无效
申请号: | 201010608118.4 | 申请日: | 2010-12-27 |
公开(公告)号: | CN102541910A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 王宵栋;张丽晓 | 申请(专利权)人: | 上海杉达学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海集信知识产权代理有限公司 31254 | 代理人: | 张坤明 |
地址: | 201209 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明揭示了一种提取关键字的方法,从一段文字中提取关键字,该方法包括:分词步骤,分词步骤将所述一段文字划分成单词;停用词消除步骤,从分词步骤中划分出的单词中去除停用词;词性还原步骤,将取出停用词后的单词的词性进行还原,该词性还原步骤使用词干分析算法将单词还原成词干原型;关键字确定步骤,以词干原型为基础,在一段文字中确定每一个词干原型出现的频率,基于出现的频率确定关键字。本发明的提取关键字的方法能够迅速准确地从一段文字中提取关键字,使得由计算机提取的关键字和通过人脑理解后获得的关键字尽可能接近。 | ||
搜索关键词: | 提取 关键字 方法 | ||
【主权项】:
一种提取关键字的方法,其特征在于,从一段文字中提取关键字,该方法包括:分词步骤,分词步骤将所述一段文字划分成单词;停用词消除步骤,从所述分词步骤中划分出的单词中去除停用词;词性还原步骤,将取出停用词后的单词的词性进行还原,该词性还原步骤使用词干分析算法将单词还原成词干原型;关键字确定步骤,以所述词干原型为基础,在所述一段文字中确定每一个词干原型出现的频率,基于出现的频率确定关键字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海杉达学院,未经上海杉达学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010608118.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种新型不锈钢管自动切割下料扩口一体机
- 下一篇:倒角刀