[发明专利]一种文本分类方法、系统、装置及存储介质在审

专利信息
申请号: 201911352244.5 申请日: 2019-12-24
公开(公告)号: CN111858923A 公开(公告)日: 2020-10-30
发明(设计)人: 程浩;杨晓庆;李奘 申请(专利权)人: 北京嘀嘀无限科技发展有限公司
主分类号: G06F16/35 分类号: G06F16/35
代理公司: 成都七星天知识产权代理有限公司 51253 代理人: 杨永梅
地址: 100193 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 分类 方法 系统 装置 存储 介质
【说明书】:

本说明书实施例公开了一种文本分类方法、系统、装置及存储介质。所述文本分类方法包括:获取第一原始文本;所述第一原始文本通过第一处理模型进行向量化处理,确定所述第一原始文本的第一语义向量;通过第二处理模型,确定第二语义向量;所述第二处理模型的输入包括所述第一语义向量;通过第三处理模型,确定所述第一原始文本的一个或多个分类标记;所述第三处理模型的输入包括所述第二语义向量。本说明书实施例提供的方法可以更有效的对文本进行分类,提高分类的准确率。

技术领域

本说明书实施例涉及自然语言处理领域,特别涉及一种文本分类方法、系统、装置及存储介质。

背景技术

自然语言处理(NLP,Natural Language Processing)作为研究人与计算机交互的语言问题的基础,融合了语言学、计算机科学、数学等学科为一体,也是人工智能的核心课题之一。而在例如语义分析、情感分类等具体的自然语言处理任务中,往往需要先将海量的输入文本进行分类。通过人工手段对这些文本进行分类,工作量巨大,而且准确率难以保证。基于词典的文本分类,利用权威的词典,依照经验人工构造特征,模型准确率较高,但由于词典覆盖率低,导致模型召回率较低。

因此,希望提供一种更有效的对文本进行分类的方案。

发明内容

本说明书实施例的一个方面提供一种对文本进行分类的方法。所述方法包括:获取第一原始文本;所述第一原始文本通过第一处理模型进行向量化处理,确定所述第一原始文本的第一语义向量;通过第二处理模型,确定第二语义向量;所述第二处理模型的输入包括所述第一语义向量;通过第三处理模型,确定所述第一原始文本的一个或多个分类标记;所述第三处理模型的输入包括所述第二语义向量。

本说明书实施例的另一个方面提供一种对文本进行分类的系统。所述系统包括:数据获取模块,用于获取第一原始文本;语义向量模块,用于所述第一原始文本通过第一处理模型进行向量化处理,确定所述第一文本的第一语义向量;以及用于通过第二处理模型,确定第二语义向量;所述第二处理模型的输入包括所述第一语义向量;分类标记模块,用于通过第三处理模型,确定所述第一原始文本的一个或多个分类标记;所述第三处理模型的输入包括所述第二语义向量。

本说明书实施例的另一个方面提供一种对文本进行分类的装置。所述装置包括处理器以及存储器;所述存储器用于存储指令,其特征在于,所述指令被所述处理器执行时,导致所述装置实现对文本进行分类的方法对应的操作。

本说明书实施例的另一个方面提供一种计算机可读存储介质。所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行对文本进行分类的方法。

附图说明

图1为根据本说明书一些实施例所示的文本进行分类的方法的示例性流程图。

图2为根据本说明书一些实施例所示的第二处理模型训练的方法的示例性流程图。

图3为根据本说明书一些实施例所示的结合对应评估人的特征和对应车辆的出行特征对用车评价文本进行分类的方法的示例性流程图。

图4为根据本说明书一些实施例所示的结合历史评估分类对用车评价文本进行分类的方法的示例性流程图。

图5为根据本说明书一些实施例所示的结合第三语义向量的文本进行分类的方法的示例性流程图。

具体实施方式

为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911352244.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top