[发明专利]Web主题倾向性挖掘与决策支持的方法有效

专利信息
申请号: 201310059170.2 申请日: 2013-02-26
公开(公告)号: CN103116644A 公开(公告)日: 2013-05-22
发明(设计)人: 张振刚;徐浩;杨沛;丁卓 申请(专利权)人: 华南理工大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: web 主题 倾向性 挖掘 决策 支持 方法
【权利要求书】:

1.一种Web主题倾向性挖掘与决策支持的方法,其特征在于,包括步骤:

S1.网络信息抽取与储存,通过网络挖掘技术,在互联网上获取信息,并将结果存入数据库和本地文件系统;

S2.信息的观点主题检测与跟踪,利用专题评论数据,检测识别出感兴趣的具有完整语义信息的观点主题,并持续跟踪和关注该观点主题;

S3.观点主题情感倾向性识别,对企业的热点话题进行话题情感倾向性分类,挖掘出观点主题的情感倾向性。

2.根据权利要求1所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S1还包括:

S11. 自然语言处理对原始网络信息进行预处理,包括:中文分词、词性标注、停用词处理,命名实体识别。

3.根据权利要求2所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S2中观点主题检测与跟踪的过程具体包括:

S21.从网络上采集到的信息,经过基于模板的信息分类,过滤噪声信息;

S22.将过滤后的相关信息,采用基于时间函数的增量聚类方法,实现子话题的检测,并将结果存储到数据库子话题表中;

S23.根据子话题的结果,提取出子话题的摘要和关键词,并修改子话题表相关信息;

S24.在根据子话题的信息,再次根据间窗口相似度比较的增量聚类方法,进行话题检测,并提取关键词,得到话题信息存入数据库;

S25.根据话题中信息的时间和话题中信息的数量,发现热点话题,并呈现给用户。

4.根据权利要求3所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S22中子话题的检测的过程具体包括:

S221.顺序处理相关信息中的每篇文档;

S222.利用层次聚类方法对未处理过的文档进行聚类;

S223.若不存在历史聚类,则根据当前聚类结果,存储子话题;

S224.若存在历史聚类,则对历史子话题和新聚类出的子话题,再次进行层次聚类;

S225.将新产生的子话题存入数据库;

S226.更新子话题与文档的关系;

S227.计算新产生和更新过的子话题的关键词、多文档摘要等信息存入数据库。

5.根据权利要求3所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S24中话题的检测的过程具体包括:

S241.顺序处理每个子话题;

S242.第一个子话题的向量自动成为第一个聚类的聚类中心;

S243.如果相似度大于某个阈值,则该子话题被分配给这个聚类;

S244.当一篇子话题分配给某个聚类的时候,重新计算这个聚类的聚类中心;

S245.若某子话题没有分配给任何的聚类,则该子话题成为一个新的聚类,同时也是这个聚类的聚类中心;

S246.将新产生的话题,添加到数据库;

S247.更新话题的信息。

6.根据权利要求1所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S3中网络主题情感倾向性识别的过程具体包括:

S31.训练话题情感分类模型,读取标注好的话题语料和情感词典,利用SVM分类算法,通过训练得到话题情感分类模型;

S32.子话题情感分类,对子话题抽取情感特征,利用话题情感分类模型及SVM分类算法获取子话题分类结果;

S33.话题情感分类,利用子话题情感分类的结果,构建基于子话题的图模型,根据图模型输出话题情感分类结果。

7.根据权利要求6所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S31中训练话题情感分类模型的过程具体包括:

S311. 读入标注好的话题情感分类语料;

S312. 通过自然语言处理,得到经中文分词和词性标注好的语料;

S313. 根据情感词典和语法模式库,从语料中抽取情感特征,构造话题分类训练数据集;

S314. 分类器读取训练数据集,利用SVM分类算法,通过训练得到话题情感分类模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310059170.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top