[发明专利]一种商品自动分类方法、装置及计算机设备在审
| 申请号: | 202110936505.9 | 申请日: | 2021-08-16 |
| 公开(公告)号: | CN113779243A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 宋字林 | 申请(专利权)人: | 深圳市世强元件网络有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/289;G06Q30/06 |
| 代理公司: | 深圳市瑞方达知识产权事务所(普通合伙) 44314 | 代理人: | 郭方伟 |
| 地址: | 518000 广东省深圳市龙岗区坂田街道雪岗路*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 商品 自动 分类 方法 装置 计算机 设备 | ||
1.一种商品自动分类方法,其特征在于,包括下述步骤:
S1、使用商品分类词库提取每个商品的商品描述信息中的商品分类词,所述商品分类词库包括多个预设商品分类词;
S2、统计每个所述商品分类词的出现次数,将出现次数最多的商品分类词作为一级分类词;
S3、统计与上级分类词同时出现的商品分类词,将与上级分类词同时出现次数最多的商品分类词作为次级分类词;
S4、重复所述步骤S3直至上级分类词找不到同时出现的商品分类词,将各级分类词按层级组合为商品分类层级树,所述商品分类层级树中包含各个商品和各级分类词的对应关系。
2.根据权利要求1所述的商品自动分类方法,其特征在于,所述商品描述信息包括标题、摘要和关键词,则所述步骤S1中使用商品分类词库提取每个商品的商品描述信息中的商品分类词包括:
使用商品分类词库中的预设商品分类词对所述标题、所述摘要和所述关键词进行分词,从分词中提取每个商品的商品描述信息中的商品分类词。
3.根据权利要求1所述的商品自动分类方法,其特征在于,所述步骤S3包括:
S31、统计与所述一级分类词同时出现的商品分类词,将与所述一级分类词同时出现次数最多的商品分类词作为二级分类词。
4.根据权利要求3所述的商品自动分类方法,其特征在于,所述步骤S3包括:
S32、统计与所述一级分类词和所述二级分类词同时出现的商品分类词,将与所述一级分类词和所述二级分类词同时出现次数最多的商品分类词作为三级分类词。
5.根据权利要求1所述的商品自动分类方法,其特征在于,在所述步骤S3中,若至少两个层级分类词组合后为同一商品对应的分类关键词,则仅保留其中一组层级分类词。
6.根据权利要求1所述的商品自动分类方法,其特征在于,所述步骤S4中重复所述步骤S3直至上级分类词找不到同时出现的商品分类词包括:重复所述步骤S3直至分级级数达到预设分级级数。
7.根据权利要求1所述的商品自动分类方法,其特征在于,在所述步骤S4之后还包括:
S51、使用商品分类词库提取新增商品的商品描述信息中的商品分类词,查找所述商品分类词在所述商品分类层级树的位置,将所述新增商品添加至所述商品分类层级树。
8.根据权利要求1所述的商品自动分类方法,其特征在于,在所述步骤S4之后还包括:
S52、若所述商品分类词库不包含新增商品对应的商品分类词,则将所述新增商品的商品分类词添加至所述商品分类词库中;使用更新后的商品分类词库重新执行所述步骤S1至步骤S4,更新所述商品分类层级树。
9.一种商品自动分类装置,其特征在于,包括:
提取单元,用于使用商品分类词库提取每个商品的商品描述信息中的商品分类词,所述商品分类词库包括多个预设商品分类词;
第一分级单元,用于统计每个所述商品分类词的出现次数,将出现次数最多的商品分类词作为一级分类词;
第二分级单元,用于统计与上级分类词同时出现的商品分类词,将与上级分类词同时出现次数最多的商品分类词作为次级分类词;
第三分级单元,用于重复执行所述第二分级单元直至上级分类词找不到同时出现的商品分类词,将各级分类词按层级组合为商品分类层级树,所述商品分类层级树中包含各个商品和各级分类词的对应关系。
10.一种计算机设备,其特征在于,包括处理器和存储器,所述处理器通信连接所述存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器中存储的计算机程序以实现如权利要求1至8任一项所述的商品自动分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世强元件网络有限公司,未经深圳市世强元件网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110936505.9/1.html,转载请声明来源钻瓜专利网。





