[发明专利]文本分类方法、文本分类装置、计算机设备及存储介质在审
申请号: | 202110776201.0 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113486175A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 吴晓东 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 詹建新 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 计算机 设备 存储 介质 | ||
本申请适用于自然语言处理技术领域,公开了一种文本分类方法、文本分类装置、计算机设备及存储介质。一种文本分类方法包括对目标文本进行分字得到的字符序列进行文本特征提取,得到第一矩阵,第一矩阵用于表征目标文本的文本特征;将第一矩阵与基于目标文本的标签信息得到的第二矩阵,输入标签注意力网络进行特征融合,得到第三矩阵;将第三矩阵输入分类卷积网络进行分类处理,得到目标文本的分类结果。本申请将目标文本的文本特征向量与标签特征进行融合,能够令融合后的特征用于文本分类时,既考虑了目标文本实际内容的权重,还考虑了目标文本与其他文本之间的相同之处的权重或不同之处的权重,提高了文本分类的准确率。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种文本分类方法、文本分类装置、计算机设备及存储介质。
背景技术
文本分类是自然语言处理(Natural Language Processing,NLP)领域中最基本的任务,文本分类的准确率是文本分类方法重要的评判标准之一,而提升文本分类的准确率可以通过分字符、数据清洗、特征提取、模型建立以及训练语料等步骤实现。目前,通常基于卷积神经网络模型进行文本分类,卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,CNN中的人工神经元可以响应一部分覆盖范围内的周围单元,在图像处理有出色表现,其应用于文本分类中时,需要对输入文本进行文本特征提取后再进行分类。
现有的文本分类算法都是只是对输入文本中的字或词进行特征编码,然后基于特征编码得到的特征向量对文本进行分类,所考虑的文本信息单一,导致对输入文本的特征提取的质量不高,从而影响了文本分类的整体准确率。
发明内容
本申请实施例提供一种文本分类方法、文本分类装置、计算机设备及存储介质,以解决现有文本分类方法在对目标文本进行特征提取时,由于所考虑的文本信息单一,文本特征提取质量不高,导致的文本分类准确率低的问题。
第一方面,本申请实施例提供一种文本分类方法,包括:
对目标文本进行分字得到的字符序列进行文本特征提取,得到第一矩阵,所述第一矩阵用于表征所述目标文本的文本特征。
将所述第一矩阵与基于所述目标文本的标签信息得到的第二矩阵,输入标签注意力网络进行特征融合,得到第三矩阵。
将所述第三矩阵输入分类卷积网络进行分类处理,得到所述目标文本的分类结果。
第二方面,本申请实施例提供一种文本分类装置,包括:
特征提取模块,用于对目标文本进行分字得到的字符序列进行文本特征提取,得到第一矩阵,所述第一矩阵用于表征所述目标文本的文本特征。
特征融合模块,用于将所述第一矩阵与基于所述目标文本的标签信息得到的第二矩阵,输入标签注意力网络进行特征融合,得到第三矩阵。
文本分类模块,用于将所述第三矩阵输入分类卷积网络进行分类处理,得到所述目标文本的分类结果。
第三方面,本申请实施例提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述文本分类方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述文本分类方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110776201.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于儿科垃圾桶的压缩装置
- 下一篇:动力电池