[发明专利]基于图模型的软件项目语义信息表示及检索方法在审
申请号: | 201410156422.8 | 申请日: | 2014-04-18 |
公开(公告)号: | CN103927360A | 公开(公告)日: | 2014-07-16 |
发明(设计)人: | 谢冰;朱子骁;华哲邦 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 王海洋 |
地址: | 100080*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 软件 项目 语义 信息 表示 检索 方法 | ||
技术领域
本发明涉及一种软件项目语义信息的表示及检索方法,尤其是涉及一种采用图模型表示和检索软件项目语义信息的方法。
背景技术
在软件开发中,软件代码、文档等的存储往往以传统的文件系统、关系型数据库等形式为主,对文档中蕴含的语义信息不进行处理和明确的表示。但是,软件代码和文档中提供了理解该软件的重要资源,其中包含了软件业务领域的需求分析、软件的系统架构、程序结构、软件功能的实现流程、软件使用方法等信息,这些包含了描述软件项目语义的信息,对于项目开发者理解软件业务需求、参与代码编写都有重要作用。
目前,关于表示软件项目资源中的语义信息的现有技术主要有基于NOSQL(Not Only SQL)数据库的表示方式和基于语义网表技术的表示方式,但是这些技术的局限之处在于语义网的描述框架的使用和构造存在一定难度,尚未有软件工程领域的应用技术。
因此,对软件构件、软件系统或项目的代码、文档等资源进行深入分析,对其中蕴含的软件项目语义信息进行清晰合理的展示,进而帮助软件复用者、开发者更容易地理解软件项目,是一项亟待解决的问题,对于软件开发效率的提高具有重要意义。。
发明内容
本发明主要是解决现有技术中所存在的缺乏有效表示软件项目文档中所蕴含的丰富语义信息的表示和处理方法等问题,提供了一种软件项目语义信息的表示方法,该方法可以对代码、文档等各类软件资源中蕴含的语义信息进行整合、关联、存储和查询,以帮助软件开发者、复用者对软件项目资源进行更深入的理解,并帮助解决实际开发中可能遇到的问题。
本发明还有一目的是解决现有技术中所存在的缺乏有效查找软件项目中与语义相关的文档代码等问题,提供了一种对基于图模型表示的软件项目语义信息进行检索的方法。该方法将图模型查询技术、文本索引检索技术、关联定位技术相结合,能基于软件项目语义信息快速进行检索。
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种基于图模型的软件项目语义信息表示方法,包括:
抽取软件项目信息的步骤:从软件项目资源中抽取结构化信息本体和无结构信息本体;
存储结构化信息本体的步骤:将结构化信息本体以图数据库形式进行表示和存储;
存储无结构信息的步骤:以文件形式存储无结构信息本体,并建立结化信息本体和无结构信息本体之间的关联关系。
优化的,上述的一种基于图模型的软件项目语义信息表示方法,所述抽取软件项目信息的步骤进一步包括以下子步骤:
步骤2.1:将结构化信息本体构建成一个抽象语法树,结构化信息本体的每个元素都对应一个抽象语法树上的结点;
步骤2.2:根据步骤2.1中构建的语法树上的结点所包含的具体元素内容,构建抽象语法树各结点之间的关系;
步骤2.3:将步骤2.1中构建的语法树上的结点和步骤2.2中构建的各结点之间的关系储存在数据库中。
优化的,上述一种基于图模型的软件项目语义信息表示方法,所述结构化信息本体是项目代码,所述步骤2.2中构建的抽象语法树各结点之间的关系是项目代码中的继承、包含、依赖、调用、实现关系中的一种或多种。
优化的,上述一种基于图模型的软件项目语义信息表示方法,所述存储结构化信息本体的步骤进一步包括以下子步骤:
步骤4.1:为每一类结构化信息本体建立图数据库中的本体类型以及每一类本体包含的具体属性;
步骤4.2:对于每一个结构化信息本体,在图数据库中建立相应的实体,并存储其具体的属性值;
步骤4.3:为每一类结构化信息本体之间的关系建立图数据库中的关系类型以及每一类关系包含具体的属性;
步骤4.4:为每一个结构化信息本体之间的关系,在图数据库中建立相应的关系,并存储其具体的属性值,关系两端是步骤4.2中建立的实体。
优化的,上述一种基于图模型的软件项目语义信息表示方法,所述存储无结构信息的步骤进一步包括以下子步骤:
步骤5.1:在图数据库中建立用来表示无结构本体的文档类型以及用来表示结构化信息本体和无结构信息本体之间关联的关系类型;
步骤5.2:将无结构信息按照步骤5.1所建立的文档类型进行存储并建立表示无结构文本与该无结构文本在图模型库中存储的无结构信息本体之间对应关系的索引表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410156422.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络接入方法及终端设备
- 下一篇:控制终端接入的方法、装置及无线路由器