[发明专利]一种构建面向社交网络的兴趣主题语义网络的方法有效
申请号: | 201610266254.7 | 申请日: | 2016-04-27 |
公开(公告)号: | CN105893611B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 李华康;李涛;罗明;陈光宣;孙国梓;杨一涛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06F40/279;G06F40/284;G06Q50/00;H04L12/58 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李湘群 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种构建面向社交网络的兴趣主题语义网络的方法,以解决目前以文本分类为主的兴趣感知和消息推送方法无法适应社交网络新概念、新兴趣点的增长问题。首先从读入的网页文件中抽取所需的关键文本信息,并完成抽取关键词集,然后分析页面内关键词之间的关系,并结合历史页面中的关键词关系,构建关键词语义网络。经过主题词判别和主题词筛选进行主题词相似度计算,确定构建主题词和主题词之间的语义网络或形成新的主题。通过本发明引入的新词发现机制可以实现社交网络新词的发现,减少新词出现后的字典配置操作,实现自动化的新兴趣主题发现,有效地为检索和推荐服务提供更为新鲜、精准的主题类目。 | ||
搜索关键词: | 一种 构建 面向 社交 网络 兴趣 主题 语义 方法 | ||
【主权项】:
一种构建面向社交网络的兴趣主题语义网络的方法,其特征在于包含以下步骤:步骤1:读入网页文件;步骤2:文本提取,从上述网页文件中抽取所需的关键文本信息;步骤3:关键词抽取,从步骤2生成的文本信息中抽取关键词集;步骤4:构建关键词语义网络,分析页面内关键词之间的关系,并结合历史页面中的关键词关系,构建关键词与关键词之间的语义网络;步骤5:主题词判别,通过步骤4得到的语义网络关键词中心词计算模型,从关键词集中抽取候选主题词;步骤6:主题词筛选,将步骤5获得的候选主题词在基础主题库中进行精确匹配,如果没有找到则执行步骤7,否则则执行步骤8;步骤7:主题词相似度计算,通过主题词文本相似和步骤4得到的语义网络相似计算步骤5得到的候选主题词与基础主题库中主题词的相似度,如果相似度大于某个阈值,则执行步骤8,否则将候选主题词插入基础主题库中形成新的主题;步骤8:主题关联抽取,通过计算各主题词和关键词语义网络之间的关系,构建主题词和主题词之间的语义网络;步骤9:主题层级判别,参照事先建立的层级关系以及进一步的主题词和关键词属性关系,整理主题词之间的各层级关系;步骤10:输出主题网络。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610266254.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种热敏变色装饰台灯
- 下一篇:一种可充电型LED灯