[发明专利]标签生成方法、装置、电子设备和计算机可读介质在审
| 申请号: | 201910877832.4 | 申请日: | 2019-09-17 |
| 公开(公告)号: | CN110727797A | 公开(公告)日: | 2020-01-24 |
| 发明(设计)人: | 马玉昆 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/08;G06F16/383;G06F16/33;G06F16/9535 |
| 代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 任亚娟 |
| 地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 口味 标签 文档 目标词 用户行为数据 主题模型 计算机可读介质 标签生成 电子设备 目标词汇 拟合 商户 申请 | ||
1.一种标签生成方法,其特征在于,所述方法包括:
获取多个用户的用户行为数据;
分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,所述目标词包括店菜名称和/或商户名称;
将提取的目标词汇总为与各用户对应的文档,以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,所述主题模型包括各文档的口味标签分布;
基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。
2.根据权利要求1所述的标签生成方法,其特征在于,所述基于各文档和各口味标签,拟合主题模型,包括:
对各文档中的各目标词设定权重,统计各文档的目标词分布;
基于各文档的目标词分布和各文档中的各目标词的权重,拟合包含各口味标签的目标词分布和各文档的口味标签分布的主题模型。
3.根据权利要求2所述的标签生成方法,其特征在于,对各文档中的各目标词设定权重,包括:
确定各用户行为数据对应的行为类别;
基于预设的各行为类别的权重,获取各用户行为数据的权重;
对于每一个目标词,将该目标词所属的用户行为数据的权重,作为该目标词的权重。
4.根据权利要求3所述的标签生成方法,其特征在于,所获取的各用户行为数据的权重还与各用户行为数据的产生时间有关。
5.根据权利要求2所述的标签生成方法,其特征在于,所述基于各文档的目标词分布和各文档中的各目标词的权重,拟合包含各口味标签对应的词语分布和各文档的口味标签分布的主题模型,包括:
对于每一个文档,执行如下拟合步骤:对预设的第一狄利克雷分布进行取样,生成该文档的取样口味标签分布,其中,所述取样口味标签分布为多项式分布;对所述取样口味标签分布进行取样,得到取样口味标签;对预设的第二狄利克雷分布进行取样,生成对应所述取样口味标签的取样目标词分布,其中,所述取样目标词分布为多项式分布;按照该文档中的各目标词的权重,对所述取样目标词分布进行取样,得到取样目标词;将所得到的各取样目标词汇总为该文档对应的生成文档;
基于各文档的目标词分布和各文档对应的生成文档的取样目标词分布,利用最大期望算法拟合各口味标签的目标词分布和各文档的口味标签分布。
6.根据权利要求1所述的标签生成方法,其特征在于,所述基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签,包括:
对于每一个文档,按照口味标签的概率由大到小的顺序,选取预设数量的口味标签,将所选取的口味标签确定为该文档对应的用户的目标口味标签。
7.根据权利要求1所述的标签生成方法,其特征在于,在所述基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签之后,所述方法还包括:
从所述多个用户中选取目标用户;
查询与所述目标用户的目标口味标签相匹配的信息,其中,所述信息包括店菜信息和商户信息;
向所述目标用户推送所述信息。
8.一种标签生成装置,其特征在于,所述装置包括:
获取单元,被配置成获取多个用户的用户行为数据;
汇总单元,被配置成分别从各用户的用户行为数据中提取目标词,并获取各目标词的口味标签,其中,所述目标词包括店菜名称和/或商户名称;
拟合单元,被配置成以口味标签为主题,基于各文档和各口味标签,拟合主题模型,其中,所述主题模型包括各文档的口味标签分布;
确定单元,被配置成基于各文档的口味标签分布,确定各文档对应的用户的目标口味标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910877832.4/1.html,转载请声明来源钻瓜专利网。





