[发明专利]一种社交网络博主的embedding评估方法及系统在审
申请号: | 202010873558.6 | 申请日: | 2020-08-26 |
公开(公告)号: | CN112115981A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 魏冲冲;姜贵彬 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 蔡永波 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 embedding 评估 方法 系统 | ||
本发明实施例提供一种社交网络博主的embedding评估方法及系统,获取各待分类博主的特征信息并进行多种embedding向量训练,为每个待分类博主生成多种embedding向量;针对每种embedding向量,将其他博主的embedding向量与每个领域的设定中心博主的embedding向量之间的距离,得到多个embedding向量聚类结果;根据每种embedding向量的多个聚类结果形成对该种embedding向量的评估结果并比对,判断每种embedding向量训练优劣。不同方式训练博主embedding向量,采用与评估效果优的embedding向量进行推荐博主的方法提高推荐效果。
技术领域
本发明涉及模型训练评估,具体涉及一种社交网络博主的embedding(嵌入表达)方法及系统。
背景技术
随着移动互联网时代的到来,广大用户开始在社交媒体中寻找自己感兴趣的内容与博主,同时促使大量优秀内容生产者不断涌现。在各媒体平台,为了更好服务数以亿计的用户,实现优秀内容的有效分发,推荐系统中通常会引入博主id信息来达到千人千面的推荐效果。由于博主数量规模巨大且极具稀疏,若直接引入id作为特征,将会为推荐模型引入极大的参数量,对模型训练带来了难度。为了避免上述问题,将博主id信息embedding化是常用的技术手段,故博主embedding特征的训练效果直接影响到推荐效果的好坏,同时对用户体验产生较大影响。
Embedding训练技术由来已久,起源于nlp领域中对于词的向量表达,后因为其较强的表达能力,逐渐在推荐系统当中流行开来。目前对于embedding效果评估的方式通常是基于人工审核进行评估。
在实现本发明过程中,申请人发现现有技术中至少存在如下问题:基于人工审核的技术方案为:随机抽取训练完成后的博主embedding向量,通过余弦相似度或者其他方法计算向量间的相似度寻找与此博主相似的top n个博主;人工审核这些博主的接近程度,包括关注数差异、发博内容领域近似度、公共粉丝数等。但是存在如下缺点:样本量巨大,且受限于人力资源成本,随机抽取博主id评估样本较少,存在偶然性,缺乏统计意义;人工评估账号特征存在主观因素影响,且评估指标选择无标准判断。
发明内容
本发明实施例提供一种社交网络博主的嵌入表达embedding评估方法及系统,避免人工审核embedding向量所带来的弊端。
为达上述目的,一方面,本发明实施例提供一种社交网络博主的嵌入表达embedding评估方法,包括:
获取各待分类博主的特征信息,将每个待分类博主的特征信息进行多种嵌入表达embedding向量训练,为每个待分类博主生成多种embedding向量,其中,所述社交网络博主是指通过社交网络发布信息的人,所有待分类博主所具有的embedding向量的种类相同;
针对每种embedding向量,对所有待分类博主的该种embedding向量按照领域进行聚类,将其他博主的embedding向量与每个领域设定的中心博主的embedding向量之间的距离作为按照领域进行聚类的衡量标准,得到多个embedding向量聚类结果、以及每个embedding向量聚类结果所涉及的博主;其中,一个embedding向量聚类结果对应一个领域;
针对每种embedding向量,根据该种embedding向量的多个聚类结果、以及每个embedding向量聚类结果所涉及博主的能力标签和能力标签权重形成对该种embedding向量的评估结果,比对所有种类embedding向量的评估结果,判断每种embedding向量训练的优劣。
优选地,所述待分类博主的特征信息包括如下种类:用户与待分类博主之间的交互行为、用户与待分类博主之间的关注关系网络、以及用户与待分类博主的交互行为序列;其中,所述用户与待分类博主的交互行为序列按用户与待分类博主交互的时间顺序将交互行为拼接形成;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010873558.6/2.html,转载请声明来源钻瓜专利网。