[发明专利]一种基于地域的话题挖掘及话题走势分析方法及系统在审
申请号: | 201410800232.5 | 申请日: | 2014-12-18 |
公开(公告)号: | CN104516961A | 公开(公告)日: | 2015-04-15 |
发明(设计)人: | 姬东鸿;程飞;白旭 | 申请(专利权)人: | 北京牡丹电子集团有限责任公司数字电视技术中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于地域的话题挖掘及话题走势分析方法及系统,话题挖掘包括:按照地域对预定时间段内的网络文章进行分类;抽取每个类的类关键词;针对每个类过滤掉不符合阈值要求的类关键词;对每个类剩余的类关键词进行聚类;判断每个类相关文章数量是否达到预设阈值,如果是则由剩余的类关键词构成一个话题;话题走势分析包括:对待分析话题的帖子按时间排序;分析话题从开始产生到当前时刻的帖子走势,生成话题走势图;通过话题走势图用训练后的话题消亡模块判断该话题是否消亡。本发明采用基于话题挖掘及走势分析机制,自动挖掘出热门话题,过滤掉大量无关的信息,分析话题的走势,让用户从多个维度了解一个事件的产生发展及消亡情况。 | ||
搜索关键词: | 一种 基于 地域 话题 挖掘 走势 分析 方法 系统 | ||
【主权项】:
一种基于地域的话题挖掘及话题走势分析方法,其特征在于,话题挖掘包括如下步骤:步骤A1,获取网络文章并存入数据库;步骤A2,按照地域对预定时间段内的网络文章进行分类;步骤A3,抽取每个类的类关键词;步骤A4,针对每个类过滤掉不符合阈值要求的类关键词;步骤A5,对每个类过滤后剩余的类关键词进行聚类;步骤A6,判断每个类相关网络文章数量是否达到预设阈值,如果是则由聚类的类关键词构成一个话题,否则不形成话题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京牡丹电子集团有限责任公司数字电视技术中心;,未经北京牡丹电子集团有限责任公司数字电视技术中心;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410800232.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种电力系统海量数据管理系统及其使用方法
- 下一篇:数据查询管理方法和系统