[发明专利]知识库词条分类方法和装置、模型训练方法和装置有效
| 申请号: | 201810077103.6 | 申请日: | 2018-01-26 |
| 公开(公告)号: | CN108304530B | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 刘树林 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识库 词条 分类 方法 装置 模型 训练 | ||
本申请涉及一种知识库词条分类方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取待分类的知识库词条;获取所述知识库词条所包括的多个词条版块的版块内容;转换所述版块内容为相应的词序列;将所述词序列输入已训练的多通道卷积网络模型中的对应卷积层通道;其中,每个卷积层通道至少包含一个卷积神经网络,每个卷积层通道的卷积神经网络处理一个词条版块相应的词序列;通过所述多通道卷积网络模型中的分类层,根据多个所述卷积层通道所输出的向量进行分类,输出所述知识库词条所属的类别。本申请提供的方案可以提高知识库词条的分类准确率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种知识库词条分类方法和装置、模型训练方法和装置。
背景技术
随着计算机技术和人类文明的发展,各领域内的技术知识和各行业的词条也日益迭代更新,产生了越来越多的知识库词条,比如百科词条。知识库词条是词条的一种特定表现形式,通常包括:词条简介、词条属性、词条正文、参考资料和词条标签等。随着知识库词条的数量急剧增加,如何对知识库词条进行分类以方便管理和查阅,也变得越来越重要。
传统的知识库词条分类方法通常是采用关键词匹配法,比如,当知识库词条的词条标签中包含“小说”时,则该知识库词条就被分类为“小说”的类别。然而,基于传统的知识库词条分类方法,常常会因为知识库词条的词条属性或词条标签中的数据不准确或不完善而存在分类不准确的情况。
发明内容
基于此,有必要针对知识库词条分类不准确的技术问题,提供一种知识库词条分类方法和装置、模型训练方法和装置。
一种知识库词条分类方法,包括:
获取待分类的知识库词条;
获取所述知识库词条所包括的多个词条版块的版块内容;
转换所述版块内容为相应的词序列;
将所述词序列输入已训练的多通道卷积网络模型中的对应卷积层通道;其中,每个卷积层通道至少包含一个卷积神经网络,每个卷积层通道的卷积神经网络处理一个词条版块相应的词序列;
通过所述多通道卷积网络模型中的分类层,根据多个所述卷积层通道所输出的向量进行分类,输出所述知识库词条所属的类别。
一种知识库词条分类装置,所述装置包括:
获取模块,用于获取待分类的知识库词条;
所述获取模块还用于获取所述知识库词条所包括的多个词条版块的版块内容;
转换模块,用于转换所述版块内容为相应的词序列;
输入模块,用于将所述词序列输入已训练的多通道卷积网络模型中的对应卷积层通道;其中,每个卷积层通道至少包含一个卷积神经网络,每个卷积层通道的卷积神经网络处理一个词条版块相应的词序列;
输出模块,用于通过所述多通道卷积网络模型中的分类层,根据多个所述卷积层通道所输出的向量进行分类,输出所述知识库词条所属的类别。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述知识库词条分类方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述知识库词条分类方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810077103.6/2.html,转载请声明来源钻瓜专利网。





