[发明专利]Web主题倾向性挖掘与决策支持的方法有效
申请号: | 201310059170.2 | 申请日: | 2013-02-26 |
公开(公告)号: | CN103116644A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 张振刚;徐浩;杨沛;丁卓 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | web 主题 倾向性 挖掘 决策 支持 方法 | ||
1.一种Web主题倾向性挖掘与决策支持的方法,其特征在于,包括步骤:
S1.网络信息抽取与储存,通过网络挖掘技术,在互联网上获取信息,并将结果存入数据库和本地文件系统;
S2.信息的观点主题检测与跟踪,利用专题评论数据,检测识别出感兴趣的具有完整语义信息的观点主题,并持续跟踪和关注该观点主题;
S3.观点主题情感倾向性识别,对企业的热点话题进行话题情感倾向性分类,挖掘出观点主题的情感倾向性。
2.根据权利要求1所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S1还包括:
S11. 自然语言处理对原始网络信息进行预处理,包括:中文分词、词性标注、停用词处理,命名实体识别。
3.根据权利要求2所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S2中观点主题检测与跟踪的过程具体包括:
S21.从网络上采集到的信息,经过基于模板的信息分类,过滤噪声信息;
S22.将过滤后的相关信息,采用基于时间函数的增量聚类方法,实现子话题的检测,并将结果存储到数据库子话题表中;
S23.根据子话题的结果,提取出子话题的摘要和关键词,并修改子话题表相关信息;
S24.在根据子话题的信息,再次根据间窗口相似度比较的增量聚类方法,进行话题检测,并提取关键词,得到话题信息存入数据库;
S25.根据话题中信息的时间和话题中信息的数量,发现热点话题,并呈现给用户。
4.根据权利要求3所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S22中子话题的检测的过程具体包括:
S221.顺序处理相关信息中的每篇文档;
S222.利用层次聚类方法对未处理过的文档进行聚类;
S223.若不存在历史聚类,则根据当前聚类结果,存储子话题;
S224.若存在历史聚类,则对历史子话题和新聚类出的子话题,再次进行层次聚类;
S225.将新产生的子话题存入数据库;
S226.更新子话题与文档的关系;
S227.计算新产生和更新过的子话题的关键词、多文档摘要等信息存入数据库。
5.根据权利要求3所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S24中话题的检测的过程具体包括:
S241.顺序处理每个子话题;
S242.第一个子话题的向量自动成为第一个聚类的聚类中心;
S243.如果相似度大于某个阈值,则该子话题被分配给这个聚类;
S244.当一篇子话题分配给某个聚类的时候,重新计算这个聚类的聚类中心;
S245.若某子话题没有分配给任何的聚类,则该子话题成为一个新的聚类,同时也是这个聚类的聚类中心;
S246.将新产生的话题,添加到数据库;
S247.更新话题的信息。
6.根据权利要求1所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S3中网络主题情感倾向性识别的过程具体包括:
S31.训练话题情感分类模型,读取标注好的话题语料和情感词典,利用SVM分类算法,通过训练得到话题情感分类模型;
S32.子话题情感分类,对子话题抽取情感特征,利用话题情感分类模型及SVM分类算法获取子话题分类结果;
S33.话题情感分类,利用子话题情感分类的结果,构建基于子话题的图模型,根据图模型输出话题情感分类结果。
7.根据权利要求6所述的Web主题倾向性挖掘与决策支持的方法,其特征在于,所述步骤S31中训练话题情感分类模型的过程具体包括:
S311. 读入标注好的话题情感分类语料;
S312. 通过自然语言处理,得到经中文分词和词性标注好的语料;
S313. 根据情感词典和语法模式库,从语料中抽取情感特征,构造话题分类训练数据集;
S314. 分类器读取训练数据集,利用SVM分类算法,通过训练得到话题情感分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310059170.2/1.html,转载请声明来源钻瓜专利网。