[发明专利]文本处理方法、装置、计算机设备以及存储介质有效
| 申请号: | 202010872702.4 | 申请日: | 2020-08-26 |
| 公开(公告)号: | CN112035662B | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 叶志豪;文瑞;陈曦;张子恒;李智勇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 处理 方法 装置 计算机 设备 以及 存储 介质 | ||
本申请实施例公开了一种文本处理方法、装置、计算机设备以及存储介质,文本处理方法可以应用于人工智能领域,文本处理方法包括:获取目标文本,目标文本包括N个目标词组;根据K个文本主题和V个词汇表词组之间的主题词组权重特征集合,确定每个目标词组与K个文本主题的主题上下文特征;识别目标文本与K个文本主题之间的匹配权重特征,根据主题词组权重特征集合、匹配权重特征和每个目标词组的主题上下文特征确定目标文本的扩展主题特征;将扩展主题特征和N个目标词组的主题上下文特征组合为目标文本特征,识别目标文本特征,得到目标文本所属的业务文本类型。采用本申请,可以提高文本分类效率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种文本处理方法、装置、计算机设备以及存储介质。
背景技术
文本分类是指按照一定的分类体系或者分类标准对文本进行分类标记。文本分类结果可以为文本下游任务提供数据基础,例如,根据文本分类结果进行文本语义理解,根据文本分类结果进行精准推荐等。
目前,文本分类主要由人工完成,即人工理解整个文本后,按照预设的分类标准为文本设置对应的类型标签。由于人工分类文本需要经历人工文本理解,人工设置标签等过程,会耗费大量的时间,造成文本分类的效率低下。
发明内容
本申请实施例提供一种文本处理方法、装置、计算设备以及存储介质,可以提高文本分类效率。
本申请实施例一方面提供了一种文本处理方法,包括:
获取目标文本,所述目标文本包括N个目标词组,所述N是正整数;
根据K个文本主题和V个词汇表词组之间的主题词组权重特征集合,确定每个目标词组与K个文本主题的主题上下文特征,K和V均是正整数;
识别所述目标文本与所述K个文本主题之间的匹配权重特征,根据所述主题词组权重特征集合、所述匹配权重特征和每个目标词组的主题上下文特征确定所述目标文本的扩展主题特征;
将所述扩展主题特征和N个目标词组的主题上下文特征组合为目标文本特征,识别所述目标文本特征,得到所述目标文本所属的业务文本类型。
本申请实施例一方面提供了一种文本处理装置,包括:
获取模块,用于获取目标文本,所述目标文本包括N个目标词组,所述N是正整数;
第一确定模块,用于根据K个文本主题和V个词汇表词组之间的主题词组权重特征集合,确定每个目标词组与K个文本主题的主题上下文特征,K和V均是正整数;
第一识别模块,用于识别所述目标文本与所述K个文本主题之间的匹配权重特征;
第二确定模块,用于根据所述主题词组权重特征集合、所述匹配权重特征和每个目标词组的主题上下文特征确定所述目标文本的扩展主题特征;
组合模块,用于将所述扩展主题特征和N个目标词组的主题上下文特征组合为目标文本特征;
第二识别模块,用于识别所述目标文本特征,得到所述目标文本所属的业务文本类型。
本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述各实施例中的方法。
本申请实施例一方面提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行上述各实施例中的方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中,计算机指令被计算机设备的处理器执行时,执行上述各实施例中的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010872702.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种穿堤管道减震结构
- 下一篇:一种电机转子





