[发明专利]一种面向网络话题的热度评价方法有效
| 申请号: | 201510032875.4 | 申请日: | 2015-01-22 |
| 公开(公告)号: | CN104615685B | 公开(公告)日: | 2018-01-26 |
| 发明(设计)人: | 程学旗;杜慧;伍大勇;张瑾;郭岩;余智华;刘悦;刘玮 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种面向网络话题的热度评价方法,包括将网络话题的属性与规则中的属性进行对比;其中,所述规则是经过训练得到的,且用于指示网络话题的属性与热度值的对应关系;以及根据对比的结果得到该网络话题的热度值。本发明定义了数值评价体系,方便了用户理解话题的热度程度,有利于话题之间的热度比较;以及,采用粗糙集相关理论最优化训练集中的不一致性,学习出热度值与属性之间的关系,提供了高热度评价的效果,其中,将无限制的属性值离散化到有限的数值范围内,减小了计算的复杂度;此外,综合多种背景知识的用户的评价得到训练集,使得样本数据更为全面,尽可能地减轻了个体的偏见。 | ||
| 搜索关键词: | 一种 面向 网络 话题 热度 评价 方法 | ||
【主权项】:
一种面向网络话题的热度评价方法,包括:步骤1)、从目标时段的文档流中获得要进行热度评价的网络话题;步骤2)、将网络话题的属性与规则中的属性进行对比;其中,所述规则是经过训练得到的,且用于指示网络话题的属性与热度值的对应关系;步骤3)、根据对比的结果得到该网络话题的热度值;其中,根据以下步骤训练离散点集合以及所述规则:步骤a)、按时段采集网页,得到每个时段的网络话题;步骤b)、给定热度值的范围,由不同知识背景的参与者对每个时段的每个网络话题进行热度评价,得到每个时段的每个网络话题的热度值;步骤c)、得到训练集;其中,所述训练集的样本为每个时段的每个网络话题的属性向量,网络话题的属性向量的分量包括该网络话题在该时段的网页内容属性的属性值以及该话题在该时段和前一时段的热度值;步骤d)、在所述训练集中,对于每个时段的每个网络话题,将该网络话题在该时段的网页内容属性的属性值和在前一时段的热度值作为条件属性并且将该‑ 网络 话题在该时段的热度值作为决策属性,学习得到所述离散点集合以及所述规则;其中,每个离散点集合与一种属性相对应,其包括一个或多个按顺序排列的值,用于与网络话题的属性向量中对应的分量进行比较以将该分量转换为预定范围内的值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510032875.4/,转载请声明来源钻瓜专利网。





