[发明专利]基于BERT预训练模型和卷积网络的文本分类方法和系统在审
| 申请号: | 202110621401.9 | 申请日: | 2021-06-03 |
| 公开(公告)号: | CN113468324A | 公开(公告)日: | 2021-10-01 |
| 发明(设计)人: | 唐果;曹安蕲;傅洛伊;王新兵 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06N3/04 |
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
| 摘要: | 本发明提供了一种基于BERT预训练模型和卷积网络的文本分类方法和系统,包括:步骤1:在数据库中获取各领域的论文文本数据以及所述论文所属领域的类别标签数据;步骤2:去除文本中的噪声,将论文文本数据和类别标签数据分为训练集和测试集,保存在文本文件中;步骤3:使用BERT预训练模型对训练集和测试集中的文本数据进行字嵌入;步骤4:将每一段文本的字嵌入组成文本矩阵作为卷积神经网络的输入,使用卷积神经网络对句子矩阵进行文本的特征提取;步骤5:将卷积神经网络提取的特征输入全连接神经网络层进行分类。本发明通过全连接神经网络进行分类,使得用户能够快捷且较为准确地按学科领域对论文文献进行分类。 | ||
| 搜索关键词: | 基于 bert 训练 模型 卷积 网络 文本 分类 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110621401.9/,转载请声明来源钻瓜专利网。





