[发明专利]数据信息分类方法及装置有效

专利信息
申请号: 201910717439.9 申请日: 2019-08-05
公开(公告)号: CN112328784B 公开(公告)日: 2023-04-18
发明(设计)人: 陈成才 申请(专利权)人: 上海智臻智能网络科技股份有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06N3/0464
代理公司: 北京品源专利代理有限公司 11332 代理人: 孟金喆
地址: 201803 上海市嘉*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 信息 分类 方法 装置
【说明书】:

发明提供了一种数据信息分类方法及装置,所述方法包括:获取待分类的文本信息;对文本信息依次进行向量化处理、融合处理以及全局平均池化处理,得到每个特征向量对应的聚合信息;利用两个全连接网络对聚合信息进行筛选处理,得到每个特征向量对应的筛选参数;根据筛选参数判断特征向量是否为噪声特征,若是,则将特征向量屏蔽,并更新剩余的特征向量,得到更新后的特征向量;根据更新后的特征向量,更新多个方面的表示特征;对更新后的多个方面的表示特征进行降维处理,得到一个目标特征;根据目标特征得到文本信息的分类信息。本发明可以更加全面、准确地实现分类目的,且方法简单高效,成本低廉。

技术领域

本发明涉及信息处理技术领域,特别涉及一种数据信息分类方法、数据信息分类装置、存储介质及电子设备。

背景技术

随着信息时代的飞速发展,在互联网上拥有的信息资源越来越丰富,信息数据规模越来越巨大,表现形式也越来越多样。但是,对于海量的信息数据资源来说,其中的绝大部分都只能被人类所理解,机器对于这些信息的理解仍十分困难,特别是数量庞大的文本数据,自然语言理解也一直是非常热门的研究领域。

在自然语言处理过程中,文本分类作为内容分类、情感分析、主题识别等应用的基础,显得尤为重要。尤其是在数据分析领域,通常需要数据进行分类,然后对已分类的数据进行进一步处理。例如在智能交互中对交互日志的数据分析过程中,就需要对分类后的交互日志进行进一步的分析处理。

文本分类首先要根据文本内容分词,将分词转化为向量表示,现有技术包括SVM(支持向量机),Logistics(逻辑),RandomForest(随机森林),Bayes(贝叶斯),KNN(最临近)。SVM,Logistics,RandomForest是基于词向量方式的高维判别模型,对特征依赖比较强。Bayes,KNN基于统计方式的贝叶斯模型,高维判别模型主要问题就在于向量表达上无法表征完全文本的语义信息,而贝叶斯模型的决策边界确定是非常困难的。

因此,如何准确高效地实现数据信息的分类就成为本领域技术人员亟待解决的技术问题之一。

发明内容

为了解决上述问题,本发明提出一种数据信息分类方法、数据信息分类装置、存储介质及电子设备,以提高数据信息分类的准确率和效率。

根据上述目的,本发明实施例提供了一种数据信息分类方法,包括以下步骤:

获取待分类的文本信息;

对所述文本信息进行向量化处理,得到所述文本信息对应的文本向量;

对所述文本向量进行融合处理,得到所述文本信息的多个方面的表示特征;

对所述表示特征中包括的特征向量进行全局平均池化处理,得到每个所述特征向量对应的聚合信息;

利用两个全连接网络对所述聚合信息进行筛选处理,得到每个所述特征向量对应的筛选参数;

根据所述筛选参数判断所述特征向量是否为噪声特征,若是,则将所述特征向量屏蔽,并更新剩余的所述特征向量,得到更新后的特征向量;

根据更新后的所述特征向量,更新所述多个方面的表示特征;

对更新后的多个方面的表示特征进行降维处理,得到一个目标特征;

根据所述目标特征得到所述文本信息的分类信息。

可选地,对所述文本向量进行融合处理,得到所述文本信息的多个方面的表示特征采用以下公式处理:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910717439.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top