[发明专利]一种基于位置的社交网络中Top-k区域用户文本数据推荐方法有效
申请号: | 201710281672.8 | 申请日: | 2017-04-18 |
公开(公告)号: | CN107145545B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 赵相国;王国仁;孙永佼;毕鑫;张祯;喻鑫 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/31;G06F16/33;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 位置 社交 网络 top 区域 用户 文本 数据 推荐 方法 | ||
1.一种基于位置的社交网络中Top-k区域用户文本数据推荐方法,包括以下步骤:
1)、获取需求用户的地理位置,根据需求用户输入的需求,对社交网络中的文本数据进行分词处理,获取与需求用户的需求相匹配的关键词组;
2)、根据获取的关键词组,建立索引树DLIR-Tree,所述索引树DLIR-Tree的每个节点包含一系列的社交网络文本的发送用户,每个节点的发送用户都是由该节点的下一层的子树所包含的发送用户的集合;
3)、根据需求用户的需求、地理位置及区域半径查询索引树DLIR-Tree,得到相匹配的文本数据;
4)、对所获取的文本数据与关键词组进行相似度计算处理,得到过滤后的文本数据;
5)、根据过滤后的文本数据,进行综合评分,并根据综合评分完成Top-k区域用户文本数据推荐;
所述进行综合评分,并根据综合评分完成Top-k区域用户文本数据推荐具体为:
5.1、对过滤后的文本数据列表中的文本数据根据流行度计算公式进行流行度计算,得到流行文本数据,所述流行度计算公式为:
其中,p为文本数据,β是一个常量,Ti表示该层节点对应文本数据的评论与转发数;选定初始文本数据,将初始文本数据设定为文本根节点,子节点为上层节点文本数据的点赞次数以及转发或回复的文本数据,ki表示第i层的节点对应文本数据的点赞数;
5.2、根据关键词相关关系的文本数据评分公式,获得相关文本数据;所述相关关系的文本数据评分公式:
其中,|p.w∩q.w|为需求关键词的出现频率;sim(p,q)为文本数据与关键词组相似度,N为归一化参数,q为关键词组;
5.3、当发送用户在设定时间范围内发送多个同一主题文本数据时,则结合文本数据的发送时间,根据所有相关文本数据的总和评分公式进行评分,或根据最大评分公式进行评分:
总和评分公式:
最大评分公式:
其中,p是用户u发表的与关键词组相关的微博,tp表示与用户提出需求的时间与该微博发布时间的时间差,以月份为单位,Pu表示发送用户u发表的所有微博的集合;
5.4、根据距离评分公式对文本数据进行距离评分,获取距离需求用户设定范围内的文本数据,所述距离评分公式为:
其中,r为距离半径,l为查询位置,δ(p,q)为距离评分;
5.5、根据综合用户评分公式,获取综合评分文本数据列表,并按照总评分的高低进行排序,得到最高分文本数据,所述综合用户评分公式为:
uscore(u,q)=α·ρ(u,q)+(1-α)·δ(u,q)
其中,参数α∈(0,1),Pu表示发送用户u发表的所有微博的集合,ρ(u,q)为ρsum(u,q)或ρmax(u,q):当存在多篇微博的时候,首先将该用户所有与需求关键词组相关的微博评分都考虑在内,然后对该用户进行评分,本文考虑结合微博所发时间,给出一个基于用户所有相关微博的总和评分公式;当用户发布过的与需求关键词组相关的微博最大的评分作为推荐依据,采用基于用户所发相关微博最大评分的评分公式。
2.根据权利要求1所述的基于位置的社交网络中Top-k区域用户文本数据推荐方法,其特征在于,所述步骤1)具体包括:
1.1、对待处理的文本数据进行分词停用词、标点符号、表情处理,得到处理后的文本数据;
1.2、利用正向匹配策略与逆向匹配策略对处理后的文本数据对文本数据分词,通过相互的信息比对,以及歧义词语对的互信值比较,以互信值高一组为最终的分词结果,输出分词集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710281672.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有前进助力的助行器
- 下一篇:一种直流控制柜电源控制装置