[发明专利]文本分类处理方法和系统以及设备有效

专利信息
申请号: 201010614959.6 申请日: 2010-12-24
公开(公告)号: CN102073704A 公开(公告)日: 2011-05-25
发明(设计)人: 李建刚 申请(专利权)人: 华为终端有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 刘芳
地址: 518129 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 分类 处理 方法 系统 以及 设备
【权利要求书】:

1.一种文本分类处理方法,其特征在于,包括:

用户设备接收网络侧设备发送的分类参数;

所述用户设备对收集的文本信息进行文本预处理,获取多个文本特征;

所述用户设备根据所述分类参数,采用预先设置的数学模型对所述多个文本特征进行分类处理,获取所述多个文本特征与所述分类参数的相关程度;

所述用户设备将所述文本信息存储在相关程度最高的一组分类参数对应的文本信息主题中。

2.根据权利要求1所述的文本分类处理方法,其特征在于,所述用户设备接收网络侧设备发送的分类参数之前,还包括:

所述用户设备接收用户请求,所述用户请求包括文本信息主题;

所述用户设备发送携带有所述文本信息主题和预先设置的数学模型标识的分类参数获取请求给所述网络侧设备。

3.根据权利要求2所述的文本分类处理方法,其特征在于,所述用户设备对收集的文本信息进行文本预处理,获取多个文本特征,包括:

所述用户设备对收集的文本信息进行分词处理,获取多种词语;

所述用户设备对所述多种词语进行词性标注处理,获取多种词性的词语;

所述用户设备从所述多种词性的词语中,抽取出现频率最高的、且与所述数学模型的输入点的数量对应的多个名词词语和动词词语,作为文本特征。

4.根据权利要求1所述的文本分类处理方法,其特征在于,所述数学模型为决策树、K最近邻算法、贝叶斯网络、神经网络、Boosting或者支持向量机的数学模型。

5.根据权利要求1至4任一项所述的文本分类处理方法,其特征在于,所述收集的文本信息为所述用户设备从本地或者网络上获取的文本信息。

6.一种文本分类处理方法,其特征在于,包括:

网络侧设备接收用户设备发送的携带有文本信息主题和数学模型标识的分类参数获取请求;

所述网络侧设备根据预先设置的文本信息主题、数学模型标识和分类参数的对应关系,获取与所述文本信息主题和数学模型标识对应的分类参数;

所述网络侧设备发送所述分类参数给所述用户设备,以供所述用户设备根据所述分类参数,对预处理后获取的多个文本特征进行分类处理。

7.根据权利要求6所述的文本分类处理方法,其特征在于,还包括:

所述网络侧设备获取用于表示文本信息主题的特征词;

所述网络侧设备根据所述特征词,对预先设置的数学模型进行训练处理,获取与所述数学模型对应的分类参数;

所述网络侧设备保存所述文本信息主题、所述数学模型标识和所述分类参数的对应关系。

8.根据权利要求6或7所述的文本分类处理方法,其特征在于,所述数学模型为决策树、K最近邻算法、贝叶斯网络、神经网络、Boosting或者支持向量机的数学模型。

9.根据权利要求8所述的文本分类处理方法,其特征在于,所述网络侧设备训练的数学模型与所述用户设备采用的数学模型相对应。

10.一种用户设备,其特征在于,包括:

分类参数接收模块,用于接收网络侧设备发送的分类参数;

预处理模块,用于对收集的文本信息进行文本预处理,获取多个文本特征;

相关程度获取模块,用于根据所述分类参数,采用预先设置的数学模型对所述多个文本特征进行分类处理,获取所述多个文本特征与所述分类参数的相关程度;

分类处理模块,用于将所述文本信息存储在相关程度最高的一组分类参数对应的文本信息主题中。

11.根据权利要求10所述的用户设备,其特征在于,还包括

用户请求接收模块,用于接收用户请求,所述用户请求包括文本信息主题;

分类参数获取请求发送模块,用于发送携带有文本信息主题和预先设置的数学模型标识的分类参数获取请求给网络侧设备。

12.根据权利要求10所述的用户设备,其特征在于,所述预处理模块包括:

分词处理单元,用于对收集的文本信息进行分词处理,获取多种词语;

词性标注处理单元,用于对所述多种词性进行词性标注处理,获取多种词性的词语;

文本特征抽取单元,用于从所述多种词性的词语中,抽取出现频率最高的、且与所述数学模型的输入点的数量对应的多个名词词语和动词词语,作文文本特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为终端有限公司,未经华为终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010614959.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top