[发明专利]一种基于文本情感分析的搜索引擎系统有效
| 申请号: | 201310479475.9 | 申请日: | 2013-10-14 |
| 公开(公告)号: | CN103605658A | 公开(公告)日: | 2014-02-26 |
| 发明(设计)人: | 许可;赵吉昌;董力;范锐;李森栋 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 成金玉;杨学明 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种基于文本情感分析的搜索引擎系统,包括情感分析、情感值与关键词统计、索引建立和热点话题提取4部分。情感分析部分负责完成对文本内容进行情感分析。情感值与关键词统计部分对情感分析的结果进行统计,分析每个话题随着时间的推移,各种情感出现频率的变化,并提取涉及该话题的文本内容中的出现频次最高的关键词。索引建立部分对情感值和关键词统计数据建立索引,便于对其检索。热点话题提取部分对当前分析的网络文本进行实时监控,发现大家议论的热点话题。本发明在对网民言论进行情感分析的基础上,分析每个话题的热度曲线和网民议论该话题时提到的关键词,并实现话题搜索和热点话题的提取。 | ||
| 搜索关键词: | 一种 基于 文本 情感 分析 搜索引擎 系统 | ||
【主权项】:
一种基于文本情感分类的搜索引擎系统,其特征在于包括:情感分类模块、情感值与关键词统计模块、索引建立模块和热点话题提取模块;所述情感分类模块,完成对文本内容进行情感分类;利用朴素贝叶斯分类器对网民发布的文本内容进行情感分类,分类结果分为高兴、低落、愤怒和厌恶四种情感;所述情感值与关键词统计模块,对情感分类模块得到的四种情感进行统计;统计网民发布的文本中每个话题在每天的四种情感出现的频次,分析每个话题展示随着时间的推移,该话题的热度和情感值变化;同时提取涉及该话题的文本内容中出现频次最高的关键词,以标签云(Tag Cloud)的形式展示出来,作为网民对该话题的讨论摘要;所述索引建立模块,对情感值与关键词统计模块得到的情感值和关键词统计数据建立索引,便于检索;为热点话题提取模块和web service提供每天的情感值和关键词统计数据,供web service进行展示;帮助热点话题提取模块提取当前热点话题。Web service将统计数据可视化后展现给用户;热点话题提取模块,从索引模块中获取当前分析的网络文本的情感和关键词统计数据,使用热点话题提取算法,提取出所分析的网络文本中所讨论的热点话题。提取出的热点话题通过web service进行展示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310479475.9/,转载请声明来源钻瓜专利网。





