[发明专利]商品标签生成方法及装置有效

专利信息
申请号: 201711071583.7 申请日: 2017-11-03
公开(公告)号: CN107944946B 公开(公告)日: 2020-10-16
发明(设计)人: 刘红岩;刘申;何军 申请(专利权)人: 清华大学
主分类号: G06Q30/06 分类号: G06Q30/06
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 乔慧;刘芳
地址: 100084 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 商品 标签 生成 方法 装置
【说明书】:

发明提供一种商品标签生成方法及装置,该方法包括:服务器根据商品集合内每个商品对应的文本描述信息,获取每个商品的文本特征;商品集合包括至少两个商品;服务器根据用户的行为序列,获取每个商品的邻近对象;邻近对象包括:在用户的行为序列中,且与商品出现的时间间隔小于预设的时间间隔阈值的商品;服务器确定商品集合内部分商品的初始标签集;服务器根据文本特征、邻近对象及初始标签集,采用异源标签主题模型,为商品集合内的商品生成标签。本发明实施例提供的标签生成方法,不需要用户参与商品标签的分配,成本较低,适用性更广;另外同时利用了商品的文本描述信息以及提取自用户序列的商品邻近对象,准确率较高。

技术领域

本发明涉及互联网技术领域,尤其涉及一种商品标签生成方法及装置。

背景技术

随着互联网技术的不断发展,越来越多的用户通过互联网进行相关活动,如浏览新闻、购物等。为了帮助用户对商品进行更细致的分类和整理,也为了方便用户更快地定位感兴趣的商品,很多互联网应用中为商品分配标签,细化对商品的描述和分类,同时服务器也可以根据标签向用户推荐相应的商品。其中,标签是指用来描述商品相关属性的短语。

目前,提取标签的方法,一般采用如下两种方式:人工分配商品标签,或服务器通过分析商品的相关描述信息,提取合适的标签;其中,商品相关描述信息例如包括商品的文字描述、用户对于商品的评论等文本信息。

上述第一种方式,由于互联网上的新商品层出不穷,仅依赖少量人力人工分配商品标签存在效率低的问题;第二种方式,仅根据商品的相关描述信息,存在准确度低、不全面的问题。

发明内容

本发明提供一种商品标签生成方法及装置,以实现准确自动生成商品标签的目的。

第一方面,本发明实例提供一种商品标签生成方法,包括:

服务器根据商品集合内每个商品对应的文本描述信息,获取每个商品的文本特征;所述商品集合包括至少两个商品;

所述服务器根据用户的行为序列,获取每个商品的邻近对象;所述邻近对象包括:在所述用户的行为序列中,且与所述商品出现的时间间隔小于预设的时间间隔阈值的商品;

所述服务器确定所述商品集合内部分商品的初始标签集;每个初始标签集包括至少一个标签;

所述服务器根据所述文本特征、所述邻近对象及所述初始标签集,采用异源标签主题模型,为所述商品集合内的商品生成标签。

第二方面,本发明实例提供一种商品标签生成装置,包括:

获取模块,用于根据商品集合内每个商品对应的文本描述信息,获取每个商品的文本特征;所述商品集合包括至少两个商品;

所述获取模块,还用于根据用户的行为序列,获取每个商品的邻近对象;所述邻近对象包括:在所述用户的行为序列中,且与所述商品出现的时间间隔小于预设的时间间隔阈值的商品;

标签确定模块,用于确定所述商品集合内部分商品的初始标签集;每个初始标签集包括至少一个标签;

处理模块,用于根据所述文本特征、所述邻近对象及所述初始标签集,采用异源标签主题模型,为所述商品集合内的商品生成标签。

本发明实例提供的商品标签生成方法及装置,通过对商品文本描述信息和用户行为序列的分析,获取商品的文本特征和邻近对象,另外由少量人工确定部分商品的初始标签集,然后采用异源标签主题模型,模拟商品文本特征、临近对象和商品标签的生成过程,确定商品隐含主题分布和标签主题分布,进一步为所有商品生成标签。该商品标签的生成过程中,仅需要少量的人工参与,无需用户参与分配商品标签,因此相对成本低,适用范围广。另外,在异源标签主题模型中,商品的文本特征信息和邻近对象信息被同时用于生成商品标签,从而与仅基于商品文本描述信息生成标签的传统方法相比,本发明实例提供的商品标签生成方法生成的标签准确度和召回率都比较高。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711071583.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top