[发明专利]类别识别方法、装置、电子设备及计算机可读存储介质有效
申请号: | 201711271261.7 | 申请日: | 2017-12-05 |
公开(公告)号: | CN107958270B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 郁延书;龚建 | 申请(专利权)人: | 北京小度信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 刘真 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 类别 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本公开实施例公开了一种类别识别方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取系统对象类别训练数据集,所述系统对象类别训练数据集中的系统对象数据具有评价类别;对所述系统对象类别训练数据集进行训练,得到系统对象类别识别模型;根据所述系统对象类别识别模型对测试对象进行类别识别。本公开实施例提供的技术方案,脱离了对于人工标注的依赖,能够对于系统对象进行自动类别识别,且能够取得较高的类别识别准确率,该方案省时省力,维护成本低,准确率高,能够实现为用户提供精准服务的目标,进而增强用户体验。
技术领域
本公开涉及信息处理技术领域,具体涉及一种类别识别方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术的发展,越来越多的商户或者服务提供商通过互联网渠道来推广产品和服务,并力求在推广产品和服务的基础上争取更多的用户订单,以提升现有资源的利用率,为商户或者服务提供商创造更多的价值。为了能够为用户提供更为精准的服务,互联网平台对于其能够提供的服务均进行了分类,但目前,这些分类基本都是依靠人工标注完成,在数据量巨大且呈迅速增长趋势的情况下,这样人工分类的方式不仅耗时耗力、维护成本高,而且还存在准确率低下的缺陷,这样就不能够实现为用户提供精准服务的目标,进而还会削弱用户体验。
发明内容
本公开实施例提供一种类别识别方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例中提供了一种类别识别方法。
具体的,所述类别识别方法,包括:
获取系统对象类别训练数据集,所述系统对象类别训练数据集中的系统对象数据具有评价类别;
对所述系统对象类别训练数据集进行训练,得到系统对象类别识别模型;
根据所述系统对象类别识别模型对测试对象进行类别识别。
结合第一方面,本公开在第一方面的第一种实现方式中,所述获取系统对象类别训练数据集,包括:
获取第一预设历史时间段内已分类系统对象数据,其中,所述系统对象数据包括:对象名称、对象类别、源属性、产品名称、产品产出量中的一种或多种;
对具有同一源属性的系统对象的类别进行评价,将评价分值高于预设评价阈值的类别作为该源属性所有系统对象的评价类别;
将具有评价类别的系统对象数据作为系统对象类别训练数据,生成所述系统对象类别训练数据集。
结合第一方面,本公开在第一方面的第一种实现方式中,所述对具有同一源属性的系统对象的类别进行评价,将评价分值高于预设评价阈值的类别作为该源属性所有系统对象的评价类别,包括:
统计具有同一源属性且具有同一类别的系统对象的数量;
按照数量的大小确定相应类别的评价分值;
将评价分值高于预设评价阈值的类别确定为该源属性所有系统对象的评价类别。
结合第一方面,本公开在第一方面的第一种实现方式中,所述对系统对象类别训练数据集进行训练,得到系统对象类别识别模型,包括:
提取系统对象类别训练数据的训练特征;
根据训练数据的类型和识别结果目标类型确定分类函数;
基于训练数据训练确定所述分类函数的参数,得到所述系统对象类别识别模型。
结合第一方面,本公开在第一方面的第一种实现方式中,所述提取系统对象类别训练数据的训练特征,包括:
基于系统对象类别训练数据确定系统对象产出词典,其中,所述系统对象产出词典包括每一系统对象每一产品的产出数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小度信息科技有限公司,未经北京小度信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711271261.7/2.html,转载请声明来源钻瓜专利网。