[发明专利]在话题关联计算中使用的方法及装置有效

专利信息
申请号: 201811457347.3 申请日: 2018-11-30
公开(公告)号: CN109739959B 公开(公告)日: 2021-02-26
发明(设计)人: 杜鹏;王亮;李健;王伟光 申请(专利权)人: 东软集团股份有限公司
主分类号: G06F16/332 分类号: G06F16/332
代理公司: 北京英创嘉友知识产权代理事务所(普通合伙) 11447 代理人: 赵杰;魏嘉熹
地址: 110179 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 话题 关联 计算 使用 方法 装置
【说明书】:

本公开涉及一种在话题关联计算中使用的方法及装置。该方法包括:通过为若干个待选择话题分配随机权重,得到用于在SCA算法中迭代的种群,种群的每个个体中,每个待选择话题均具有对应的权重分量;利用SCA算法对种群中的个体进行迭代更新,SCA算法使用的适应度函数以个体为变量,在适应度函数的解析式中,由待选择话题与已关注话题之间的关联性统计数量对待选择话题的权重分量进行修正;将SCA算法迭代结束后种群最优解个体作为已关注话题与若干个待选择话题的关联度进行输出。由于最优个体的权重可以达到与表征关联性的统计数量相适应的最优权重,且SCA算法迭代过程具高效的特点,因此,本公开实现了高效率地进行话题关联计算的目的。

技术领域

本公开涉及数据挖掘领域,具体地,涉及一种在话题关联计算中使用的方法及装置。

背景技术

当今,是知识爆炸的时代,只有不断学习才能够提高自己的知识储备量。为了便于学习,很多企业都建立了知识门户网站。用户可以登录到公司的知识门户网站,进入知识库学习,关注自己感兴趣的话题。同时,系统也可以根据用户关注的话题推荐相关的话题,包括文章、书籍、行业专家等。

话题关联计算的核心是话题关联度。目前,一般采用的是余弦相似度算法来计算话题关联度。但是,余弦相似度算法需要先计算复杂的语义信息,如特征词的概率分布等,得到词向量,再对词向量之间的夹角进行计算,才能得到话题间的关联度,计算复杂,效率低。

发明内容

有鉴于此,本公开的目的是提供一种在话题关联计算中使用的方法及装置,以实现高效率地进行关联话题计算的目的。

在本公开实施例的第一个方面中,提供了一种在话题关联计算中使用的方法,该方法包括:通过为若干个待选择话题分配随机权重,得到用于在SCA算法(sine cosinealgorithm,正弦余弦算法)中迭代的种群,其中,所述种群的每个个体中,每个待选择话题均具有对应的权重分量;利用SCA算法对所述种群中的个体进行迭代更新,其中,所述SCA算法使用的适应度函数以所述个体为变量,在所述适应度函数的解析式中,由所述待选择话题与已关注话题之间的关联性统计数量对所述待选择话题的权重分量进行修正;将所述SCA算法迭代结束后所述种群中最优解个体作为所述已关注话题与所述若干个待选择话题的关联度进行输出。

可选地,所述待选择话题与已关注话题之间的关联性统计数量为待选择话题与已关注话题在若干篇文档资料中同篇出现的次数;所述适应度函数fit(Wk)的解析式为:其中,Wk表示所述种群中第k个个体;|Topic|表示用户已经关注的话题的个数,|T|表示所述待选择话题的个数,topici表示第i个已关注话题;tj表示第j个待选择话题,wkj表示Wk的第j个待选择话题的权重分量,count(topici,tj)的函数返回值表示第i个已关注话题与第j个待选择话题在所述若干篇文档资料中同篇出现的次数。

可选地,所述方法还包括:在所述SCA算法迭代的每次迭代中,获取更新的动态淘汰值,所述动态淘汰值随着迭代次数增加逐渐减小;在每次迭代中,在允许被淘汰的个体数量大于等于所述动态淘汰值的情况下,从所述种群中淘汰出与所述动态淘汰值相应数量的允许被淘汰的个体,在允许被淘汰的个体数量小于所述动态淘汰值的情况下,从所述种群中淘汰出允许被淘汰的个体。

可选地,所述方法还包括:在所述SCA算法迭代的每次迭代中,保存所述适应度函数对应于当前迭代得到的种群个体的函数值;在所述SCA算法迭代的每次迭代中,根据上一次迭代保存的函数值及所述种群中个体数量,计算出种群平均适应度值;在所述SCA算法迭代的每次迭代中,通过将所述适应度函数对应于当前迭代得到的种群个体的函数值与当前迭代中计算出的种群平均适应度值进行比较,从所述种群中筛选出允许被淘汰的个体。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811457347.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top