[发明专利]一种基于GBP的CB方法在审

专利信息
申请号: 202010369816.7 申请日: 2020-05-06
公开(公告)号: CN111581526A 公开(公告)日: 2020-08-25
发明(设计)人: 吴健;王强;刘智平 申请(专利权)人: 上海解兮生物科技有限公司
主分类号: G06F16/9536 分类号: G06F16/9536;G06F40/194;G06K9/62;G06Q30/06
代理公司: 北京恒泰铭睿知识产权代理有限公司 11642 代理人: 周成金
地址: 200120 上海市浦东新区自由*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 gbp cb 方法
【权利要求书】:

1.一种基于GBP的CB方法,其特征在于,包含以下步骤:

1)根据用户的GBP数据对用户进行标签化,每个用户就都拥有了各自的GBP标签,每个标签代表一个不同的item;

2)对内容进行手动打标签,使内容也拥有了一个或多个标签:

3)根据用户的标签和内容标签进行初步的匹配,经过用户使用、反馈和算法校准,用户已经对一些item做出了喜好判断,喜欢其中的一部分item,不喜欢其中的另一部分;

4)通过用户过去的喜好判断,为用户形成一个通用模型,后续根据用户的实习操作的数据反馈进行标签权重系数的调整进而优化推荐系统的推荐机制:

5)商品推荐,通过上述通用模型,就可以判断用户是否会喜欢一个新的item,最终得到推荐结果。

2.根据权利要求1中所述的一种基于GBP的CB方法,其特征在于,所述的内容为文章、视频、商品、图片等。

3.根据权利要求2中所述的一种基于GBP的CB方法,其特征在于,文章中,item是人,一个item会有结构化属性如身高、学历、籍贯等,也会有非结构化属性,如item写的个人签名,发布的内容等等;对于结构化数据,可以拿来就用;但对于非结构化数据(如文章),往往要先把它转化为结构化数据后才能在模型里加以使用;

要表征的所有文章集合为D={d1,d2,…,dN},而所有文章中出现的词的集合为T={t1,t2,…,tn};也就是说,我们有N篇要处理的文章,而这些文章里包含了n个不同的词;

最终要使用一个向量来表示一篇文章,比如第j篇文章被表示为dj={w1j,w2j,…,wnj},其中wij表示第i个词在文章j中的权重,值越大表示越重要。

4.根据权利要求3中所述的一种基于GBP的CB方法,其特征在于,所述的内容为文章,记我们要表示的所有文章集合为D={d1,d2,...,dN},而所有文章中出现的词(对于中文文章,首先得对所有文章进行分词)的集合(也称为词典)为T={t1,t2,...,tn};也就是说,我们有N篇要处理的文章,而这些文章里包含了n个不同的词;我们最终要使用一个向量来表示一篇文章,比如第j篇文章被表示为dj=(w1j,w2j,...,wnj),其中w1j表示第1个词t|在文章j中的权重,值越大表示越重要;dj中其他向量的解释类似;所以,为了表示第j篇文章,现在关键的就是如何计算dj各分量的值了;第j篇文章中与词典里第k个词对应的词频-逆文档频率为:

其中TF(tk,dj)是第k个词在文章j中出现的次数,而nk是所有文章中包括第k个词的文章数量;

最终第k个词在文章j中的权重由下面的公式获得:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海解兮生物科技有限公司,未经上海解兮生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010369816.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top