[发明专利]网络信息的分类方法及系统在审
| 申请号: | 201680000012.1 | 申请日: | 2016-01-07 |
| 公开(公告)号: | CN105723367A | 公开(公告)日: | 2016-06-29 |
| 发明(设计)人: | 马岩 | 申请(专利权)人: | 马岩 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 深圳市科冠知识产权代理有限公司 44355 | 代理人: | 孔丽霞 |
| 地址: | 518000 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 信息 分类 方法 系统 | ||
技术领域
本发明涉及互联网领域,尤其涉及一种网络信息的分类方法及系统。
背景技术
网络是由节点和连线构成,表示诸多对象及其相互联系。在数学上,网络是一种图,一般认为专指加权图。网络除了数学定义外,还有具体的物理含义,即网络是从某种相同类型的实际问题中抽象出来的模型。在计算机领域中,网络是信息传输、接收、共享的虚拟平台,通过它把各个点、面、体的信息联系到一起,从而实现这些资源的共享,网络是人类发展史来最重要的发明,提高了科技和人类社会的发展。
网络信息是海量的,那如何对网络信息进行分类就成为网络搜索中的关键技术,当下的网络信息分类的方式有很多种,但是分类大多数不准确。
发明内容
本申请提供一种网络信息的分类方法。其解决现有技术的技术方案网络信息分类不准确的缺点。
一方面,提供一种网络信息的分类方法,所述方法包括如下步骤:
获取需要分类的网络信息;
对该网络信息进行分词处理,对分词处理得到的相同词汇进行数量统计;
将数量最多的词汇的类别作为该网络信息的第一类别。
可选的,所述方法还包括:
将该网络信息输入该第一类别对应的学习向量机中输出该网络信息的第二类别,如该第二类别与第一类别相同,则确定该网络信息的类别为第一类别。
可选的,所述方法还包括:
如第二类别与第一类别不相同,则重新对网络信息进行分类处理。
第二方面,提供一种网络信息的分类系统,所述系统包括:
获取单元,用于获取需要分类的网络信息;
分词单元,用于对该网络信息进行分词处理,对分词处理得到的相同词汇进行数量统计;
类别单元,用于将数量最多的词汇的类别作为该网络信息的第一类别。
可选的,所述系统还包括:
学习单元,用于将该网络信息输入该第一类别对应的学习向量机中输出该网络信息的第二类别,如该第二类别与第一类别相同,则确定该网络信息的类别为第一类别。
可选的,所述系统还包括:
重处理单元,用于如第二类别与第一类别不相同,则重新对网络信息进行分类处理。
本发明提供的技术方案对网络信息进行分词处理,抓取网络信息的关键词,依据该关键词的次数进行分类,所以其具有分类准确的优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一较佳实施方式提供的一种网络信息的分类方法的流程图;
图2为本发明第二较佳实施方式提供的一种网络信息的分类系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1是本发明第一较佳实施方式提出的一种网络信息的分类方法,该方法如图1所示,包括如下步骤:
步骤S101、获取需要分类的网络信息;
步骤S102、对该网络信息进行分词处理,对分词处理得到的相同词汇进行数量统计;
上述分词处理的算法可以采用现有的分词处理算法,例如百度分词处理算法等。
步骤S103、将数量最多的词汇的类别作为该网络信息的第一类别。
本发明提供的技术方案对网络信息进行分词处理,抓取网络信息的关键词,依据该关键词的次数进行分类,所以其具有分类准确的优点。
可选的,上述方法在步骤S103之后还可以包括:
将该网络信息输入该第一类别对应的学习向量机中输出该网络信息的第二类别,如该第二类别与第一类别相同,则确定该网络信息的类别为第一类别。
可选的,上述方法还可以包括:
如第二类别与第一类别不相同,则重新对网络信息进行分类处理。
请参考图2,图2是本发明第二较佳实施方式提出的一种网络信息的分类系统,该系统如图2所示,包括:
获取单元201,用于获取需要分类的网络信息;
分词单元202,用于对该网络信息进行分词处理,对分词处理得到的相同词汇进行数量统计;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马岩,未经马岩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680000012.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:计算装置安全锁
- 下一篇:共享模块环境中的因模块而异的跟踪
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





