[发明专利]文本分类方法、装置及设备有效
| 申请号: | 202010690569.0 | 申请日: | 2020-07-17 |
| 公开(公告)号: | CN111737473B | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 王君吉;张朝胜;徐琪 | 申请(专利权)人: | 浙江口碑网络技术有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/295;G06N3/08 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 分类 方法 装置 设备 | ||
1.一种文本分类方法,其特征在于,包括:
获取对餐品描述信息进行处理后所形成的文本特征,所述餐品描述信息由线上实体对象提供,所述文本特征包括反映餐品对象不同维度的描述特征;
将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,所述文本分类模型用于预测文本特征在各个类目上的概率值,所述分类结果为预测得到概率值最高时对应文本特征的类目,所述文本分类模型包括第一分类模型和第二分类模型和第三分类模型,所述第一分类模型包括用于对文本特征中不同的描述特征进行预测的分类子模型,并分别将不同的描述特征分别输入至第一分类分型所映射的分类子模型中进行预测,所述第二分类模型和所述第三分类模型用于对文本特征中对象文本的描述特征进行预测,并基于预先整理实体对象中类目映射表对文本特征在实体对象中所映射的类目进行校正,得到文本特征映射的分类结果,所述不同的描述特征包括对象文本的描述特征、实体对象文本的描述特征和对象图片的描述特征;
通过统计所述文本特征映射的多个分类结果中类目的占比值,将占比值最高的类目确定为所述文本特征映射的最终分类结果。
2.根据权利要求1所述的方法,其特征在于,所述具有不同网络结构的文本分类模型中包括具有深度神经网络结构的第一分类模型、具有浅层网络结构的第二分类模型和具有卷积神经网络结构的第三分类模型,所述将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,具体包括:
将所述文本特征输入至第一分类模型中进行预测,得到文本特征映射的第一分类结果;
将所述文本特征输入至第二分类模型中进行预测,得到文本特征映射的第二分类结果;
将所述文本特征输入至第三分类模型中进行预测,得到文本特征映射的第三分类结果。
3.根据权利要求2所述的方法,其特征在于,所述第一分类模型包括用于对文本特征中不同的描述特征进行预测的分类子模型,所述将所述文本特征输入至第一分类模型中进行预测,得到文本特征映射的第一分类结果,具体包括:
通过分析所述文本特征描述对象的维度信息,将所述文本特征划分为不同的描述特征;
确定所述不同的描述特征在第一分类模型所映射的分类子模型;
将所述不同的描述特征分别输入至第一分类模型所映射的分类子模型中进行预测,输出不同的描述特征在实体对象中所映射的类目;
通过汇总所述不同的描述特征在实体对象中所映射的类目,得到文本特征映射的第一分类结果。
4.根据权利要求3所述的方法,其特征在于,所述通过分析所述文本特征描述对象的维度信息,将所述文本特征划分为不同的描述特征,具体包括:
通过分析所述文本特征描述对象的维度信息,提取从不同维度上描述对象的描述特征;
将所述从不同维度上描述对象的描述特征划分为对象文本的描述特征、实体对象文本的描述特征、对象图片的描述特征。
5.根据权利要求2所述的方法,其特征在于,所述第二分类模型包括用于对文本特征中对象文本的描述特征进行预测的单层分类子模型,所述将所述文本特征输入至第二分类模型中进行预测,得到文本特征映射的第二分类结果,具体包括:
从所述文本特征中提取对象文本的描述特征,将所述对象文本的描述特征进行加权平均后输入至第二分类模型的单层分类子模型中进行预测,输出对象文本的描述特征在实体对象中所映射的类目;
基于预先整理实体对象中的类目映射表,对所述描述特征在实体对象中所映射的类目进行校正,得到文本特征映射的第二分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江口碑网络技术有限公司,未经浙江口碑网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010690569.0/1.html,转载请声明来源钻瓜专利网。





