[发明专利]基于属性拓扑的博客数据的形式概念计算方法有效
申请号: | 201410288698.1 | 申请日: | 2014-06-25 |
公开(公告)号: | CN104036013B | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 张涛;李慧;魏昕宇 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 秦皇岛一诚知识产权事务所(普通合伙)13116 | 代理人: | 李合印 |
地址: | 066004 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 属性 拓扑 博客 数据 形式 概念 计算方法 | ||
技术领域
本发明涉及形式概念分析领域,尤其涉及基于属性拓扑的博客数据的形式概念计算方法。
背景技术
博客是以自由、开放和共享为文化特征,通过图文音象等表现形式,围绕个人网络存在的五大功能,提供存取读写、组织沟通、评价交换等服务的一种社会化个人服务模式。它并不是纯粹的技术创新,但确是一种逐渐演变的网络应用,一种形式的变化。博客的全民性,让它的传播方式成为所有人对所有人的传播。然而,博客并不如表面般繁荣,当博客毫不掩饰地在大众面前喧闹的时候,接踵而来的问题使得博客乱了方寸。博客参与者的盲目性导致了博客行为过程中的迷茫与厌倦;由于进入的零门槛和缺少监管,彻底颠覆互联网既有模式的博客,变成了新的信息垃圾场。博客正遭受低俗肤浅成风、网络侵权等因素的困扰。
作为数据分析与知识处理的有力工具,形式概念分析以数学化的概念和概念层次为基础,已经应用在众多领域,如数据挖掘、知识发现、网络搜索、软件工程、语义分析等,并仍然具有很大的潜在应用价值。
作为国际形式概念分析的研究热点,形式概念的计算以及概念格的生成是许多学者研究的重点。经过国内外学者多年的研究,目前已经从不同角度提出多种形式概念的计算及概念格生成算法。这些算法主要可以分为三大类:批处理算法、渐进式算法和并行算法。批量算法的思想是首先生成所有的概念,然后根据它们之间的前驱-后继关系生成边,完成概念格的构造。渐进式算法的思想是先初始化概念格为空,然后将当前要插入的对象和现有概念格中的所有概念进行交运算,根据交的结果不同来更新每个概念。并行算法主要思想是将形式背景拆分为子形式背景构造子格后再进行相应的合并运算。
但是经典的概念格计算普遍复杂而且不能直观的表示形式概念中各个属性间的关联性和关联强度。形式背景的属性拓扑表示法是一种新型的表示形式背景的方法。与传统表示方法不同,属性拓扑表示以属性为顶点,属性对间的包含关系为权值,以加权图的形式对形式背景进行刻画,将属性间的耦合关系和耦合强度直观的表现在拓扑图上。形式背景的属性拓扑表示方法为形式背景的表示提供了全新的思路。其次,属性拓扑图不但简单直观的表现出各个属性之间的关联及其关联强度,而且与形式背景一一对应。
基于这种全新的表示方法,张涛等人提出了利用属性拓扑图计算形式概念的方法,该方法分别以属性拓扑的各顶层属性为中心,根据属性拓扑中与之连线数由少到多的顺序,依次作各自的属性子拓扑。然后利用以顶层属性为核心的子拓扑中属性对象的关联及关联强度,对子拓扑中可能的对象集进行整理运算,以此得到所有的外延,与相应内涵形成子拓扑中的所有概念。最终得到所有子拓扑中的概念,即该形式背景下的所有概念。利用属性拓扑求形式概念的方法为概念的计算提供了新的思路。其次,该方法使概念的计算简便易于操作。
但是属性子拓扑将原有拓扑整体割裂,不适于可视化分析。其次,该方法逻辑性较差,不适用大规模数据形式背景的形式概念计算。
发明内容
本发明的目的在于为了克服上述的不足之处,提供一种基于属性拓扑的博客数据的形式概念计算方法。该方法首先将属性拓扑退化为具有固定起点和终点的图,在此基础上,通过条件约束和计算规则的限定,利用可视化全局路径搜索无冗余、无遗漏地得到该拓扑下的所有形式概念。该方法将属性拓扑构造成一个完整的整体,避免了属性拓扑的分解过程,体现了算法的完整性。同时在路径的遍历过程中获得形式概念的直观计算过程,可视性较好。该方法通过对博客数据的形式概念计算,对博客信息资源进行了科学的整合和发掘,对斑驳繁杂的博客信息进行了“过滤”,为博客使用者迅速发现对自己有利和感兴趣的博客内容以及了解博客作者的相关信息提供了理论依据,有利于摒弃无用信息,可以促进博客文化的科学管理和博客健康、有序的发展。
本发明是通过以下技术方案实现的:一种基于属性拓扑的博客数据的形式概念计算方法,其内容包括以下步骤:
1、形式背景的属性拓扑表示
从图论的角度看,属性拓扑表示是关于属性间关系的加权图表示,因此在存储上可以借鉴图的存储方式,对属性拓扑进行邻接矩阵描述;
形式背景K:=(G,M,I)中,定义T=(V,Edge)为属性拓扑的邻接矩阵,其中V=M为拓扑的顶点集合,Edge为拓扑中边的权值集合;
属性拓扑的邻接矩阵表达式如下所示:
全局属性是指形式背景中全部的对象均包含的属性;空属性是指形式背景中不属于任何对象的属性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410288698.1/2.html,转载请声明来源钻瓜专利网。