首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]文档分类方法、装置、设备和存储介质在审

申请号：	202210650047.7	申请日：	2022-06-09
公开（公告）号：	CN115048515A	公开（公告）日：	2022-09-13
发明（设计）人：	韦中普	申请（专利权）人：	广西力意智能科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/216;G06F40/253;G06F40/289;G06F40/30;G06K9/62;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	530200 广西壮族自治区南宁***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文档分类方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文档分类方法，其特征在于，包括如下步骤：

提取待分类文档的关键词，构建关键词知识库；

获取待分类文档的词嵌入向量和所述关键词知识库的词嵌入向量；

将待分类文档的词嵌入向量和所述关键词知识库的词嵌入向量通过注意力机制融合，得到融合向量；

将所述融合向量作为全连接层的输入，从全连接层的输出得到待分类文档的分类结果。

2.根据权利要求1所述的文档分类方法，其特征在于，构建关键词知识库具体包括如下步骤：

对待分类文档进行预处理；

通过第一Bert模型提取预处理后的待分类文档的文档向量，所述第一Bert模型为已完成预训练的Bert模型，其预训练过程包括MLM和NSP两个训练任务；

使用N元语法模型从所述文档向量中提取候选关键词的词向量；

计算候选关键词的词向量与文档向量之间的相似度，根据所述相似度确定待分类文档的关键词，形成关键词知识库。

3.根据权利要求2所述的文档分类方法，其特征在于，通过计算候选关键词的词向量与文档向量之间余弦值确定候选关键词与待分类文档之间的相似度。

4.根据权利要求1所述的文档分类方法，其特征在于，通过第二Bert模型获取待分类文档的词嵌入向量和所述关键词知识库的词嵌入向量，所述第二Bert模型为已完成预训练的Bert模型，其预训练过程不包括NSP训练任务。

5.根据权利要求1所述的文档分类方法，其特征在于，所述注意力机制为多头注意力机制。

6.一种文档分类装置，其特征在于，包括：

关键词生成模块，用于提取待分类文档的关键词，构建关键词知识库；

词嵌入模块，用于获取待分类文档的词嵌入向量和所述关键词知识库的词嵌入向量；

融合模块，用于将待分类文档的词嵌入向量和所述关键词知识库的词嵌入向量通过注意力机制融合，获得融合向量；

全连接层，用于通过所述融合向量获取待分类文档的分类结果。

7.根据权利要求6所述的文档分类装置，其特征在于，所述关键词生成模块包括：

文档嵌入模块，用于提取预处理后的待分类文档的文档向量，所述文档嵌入模块包括已完成预训练的第一Bert模型，所述第一Bert模型的预训练过程包括MLM训练任务和NSP训练任务；

候选关键词生成模块，所述候选关键词生成模块包括N元语法模型，用于从所述文档向量中提取候选关键词的词向量；

关键词选取模块，用于计算候选关键词的词向量与文档向量之间的余弦相似度，根据所述余弦相似度确定待分类文档的关键词。

8.根据权利要求6所述的文档分类装置，其特征在于，所述词嵌入模块包括已完成预训练的第二Bert模型，所述第二Bert模型的预训练过程包括MLM训练任务但不包括NSP训练任务，其MLM训练任务采用动态掩码方式。

9.一种文档分类设备，其特征在于，所述文档分类设备包括：存储器和至少一个处理器，所述存储器中存储有计算机程序；所述至少一个处理器调用所述存储器中的所述计算机程序，以使得所述文档分类设备执行如权利要求1-5中任意一项所述的文档分类方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述文档分类方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广西力意智能科技有限公司，未经广西力意智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210650047.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种水电超高水头机组新型测头体焊接结构
下一篇：一种移动破柴油机直接驱动系统

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top