[发明专利]标签处理方法、装置及计算机可读存储介质在审
| 申请号: | 202011237870.2 | 申请日: | 2020-11-09 |
| 公开(公告)号: | CN112328833A | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/78 | 分类号: | G06F16/78 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标签 处理 方法 装置 计算机 可读 存储 介质 | ||
1.一种标签处理方法,其特征在于,包括:
接收目标信息流;
获取与所述目标信息流关联的多个关联信息流;
提取每一关联信息流包含的关联标签,所述关联标签携带与对应的关联信息流的关联值;
利用所述关联值计算每一关联标签与所述目标信息流的目标关联值;
按照目标关联值由高至低的顺序对关联标签进行排序,并确定排序后的关联标签序列中前预设数量个关联标签为目标标签;
将所述目标标签添加为所述目标信息流的标签。
2.根据权利要求1所述的处理方法,其特征在于,所述利用所述关联值计算每一关联标签与所述目标信息流的目标关联值,包括:
计算每一关联信息流与所述目标信息流的相似度;
根据所述相似度与所述关联值计算每一关联标签与所述目标信息流的目标关联值。
3.根据权利要求1所述的处理方法,其特征在于,所述获取与所述目标信息流关联的多个关联信息流,包括:
计算预设信息流库中的每一信息流与所述目标信息流的信息流相似度;
根据所述信息流相似度确定与所述目标信息流关联的多个关联信息流。
4.根据权利要求3所述的处理方法,其特征在于,所述计算预设信息流库中的每一信息流与所述目标信息流的信息流相似度,包括:
获取预设信息流库中每一信息流包含的标签,生成每一信息流对应的标签集合;
获取所述目标信息流包含的标签,生成目标标签集合;
计算每一标签集合与所述目标标签集合的标签相似度;
根据所述标签相似度确定每一信息流与所述目标信息流的信息流相似度。
5.根据权利要求4所述的处理方法,其特征在于,所述获取所述预设信息流库中每一信息流包含的标签,生成每一信息流对应的标签集合,包括:
获取所述预设信息流库中每一信息流的标题;
将所述标题进行切词,得到多个分词;
从所述多个分词中提取出标题标签;
根据所述标题标签与对应信息流的主题标签确定每一信息流对应的标签集合。
6.根据权利要求4所述的处理方法,其特征在于,所述计算每一标签集合与所述目标标签集合的标签相似度,包括:
将每一标签集合中的标签转化为词向量;
将所述目标标签集合中的标签转化为目标词向量;
计算每一词向量与所有目标词向量的余弦相似度;
根据所述余弦相似度计算每一标签集合与所述目标标签集合的标签相似度。
7.根据权利要求5所述的处理方法,其特征在于,所述从所述多个分词中提取出标题标签,包括:
获取预设的标签词典,所述预设的标签词典包含多个预设分词;
将所述多个分词与所述多个预设分词进行匹配;
将所述多个分词中与所述多个预设分词中至少一个预设分词相匹配的分词确定为标题标签。
8.根据权利要求5所述的处理方法,其特征在于,所述从所述多个分词中提取出标题标签,包括:
检测所述多个分词中的每一分词是否为人名;
将所述多个分词中检测结果是人名的分词确定为标题标签。
9.一种标签处理装置,其特征在于,包括:
接收单元,用于接收目标信息流;
获取单元,用于获取与所述目标信息流关联的多个关联信息流;
提取单元,用于提取每一关联信息流包含的关联标签,所述关联标签携带与对应的关联信息流的关联值;
计算单元,用于利用所述关联值计算每一关联标签与所述目标信息流的目标关联值;
确定单元,用于按照目标关联值由高至低的顺序对关联标签进行排序,并确定排序后的关联标签序列中前预设数量个关联标签为目标标签;
添加单元,用于将所述目标标签添加为所述目标信息流的标签。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8中任一项所述的标签处理方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011237870.2/1.html,转载请声明来源钻瓜专利网。





