[发明专利]一种基于社交电商公开文本信息的商品细粒度分类方法有效
| 申请号: | 202011141195.3 | 申请日: | 2020-10-23 | 
| 公开(公告)号: | CN112632273B | 公开(公告)日: | 2023-03-31 | 
| 发明(设计)人: | 陈轶;张文;崔浩亮;牛少彰;王让定 | 申请(专利权)人: | 东南数字经济发展研究院 | 
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q30/0601 | 
| 代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 陈彩云 | 
| 地址: | 324000 浙江省衢州市*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 社交 公开 文本 信息 商品 细粒度 分类 方法 | ||
1.一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,包括以下步骤:
步骤S1:从数据库读取社交电商对于商品的公开描述文本信息,根据商品属性建立一级目录标签,并根据标签的不同将文本信息分成若干类数据集;
步骤S2:对社交电商公开文本进行词性标注,参照一级目录标签,选择商品公开描述文本中与一级目录标签为被包含关系的名词性词语作为其二级目录标签;
步骤S3:根据文本在上述一级目录标签中的分类结果调用该一级目录下的二级目录标签数据,并检索该名词性词语与二级目录中相同的标签数据,得到文本所属细粒度类别。
2.根据权利要求1所述的一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,在S1中,所述的商品属性参照已公开的购物网站的一级目录分类。
3.根据权利要求1所述的一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,将S1中的数据集分成训练集、测试集和验证集并利用文本分类算法对训练集、测试集和验证集分别进行模型训练、测试和验证。
4.根据权利要求3所述的一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,所述的文本分类算法包括BERT、LSTM、TextCNN中的一种或多种。
5.根据权利要求3所述的一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,分类模型训练完成后对文本类别进行预测。
6.根据权利要求1所述的一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,在S2中使用jieba开源软件包提供的算法模板进行词性标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南数字经济发展研究院,未经东南数字经济发展研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011141195.3/1.html,转载请声明来源钻瓜专利网。





