[发明专利]基于文本认知的自动分析建模方法、系统、装置及介质在审

专利信息
申请号: 202011437720.6 申请日: 2020-12-10
公开(公告)号: CN112579444A 公开(公告)日: 2021-03-30
发明(设计)人: 黄翰;刘雨瑶;王业超;黄俊聪 申请(专利权)人: 华南理工大学
主分类号: G06F11/36 分类号: G06F11/36;G06F40/30;G06F40/242
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 常柯阳
地址: 511458 广东省广州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文本 认知 自动 分析 建模 方法 系统 装置 介质
【说明书】:

发明公开了一种基于文本认知的自动分析建模方法、系统、装置及介质,其中方法包括:获取文档,对所述文档中的语句进行筛选,获取与图元素提取相关的语句;根据预先定义的规则构建领域字典;结合构建获得的领域字典,采用依存句法分析工具对与图元素提取相关的语句进行语义分析,获得语义分析结果;制定基于语义分析的图元素提取规则;根据制定的提取规则对语义分析结果提取图元素;按照用例图的方式对提取获得的图元素进行存储。本发明能够实现自动化的需求分析建模方法,能够自动根据需求文档,分析出相应的Uml用例图,从而提高需求分析建模的准确率和软件开发的效率,可广泛应用于自然语言处理、软件工程需求分析领域。

技术领域

本发明涉及自然语言处理、软件工程需求分析领域,尤其涉及一种基于文本认知的自动分析建模方法、系统、装置及介质。

背景技术

软件工程需求分析过程是软件开发过程的重要环节,能否准确的根据需求文档,了解用户的真正意图,识别每个子系统的用户和功能需求至关重要。然而,通过传统的人工识别方式,存在着不准确、不全面、有歧义的问题。引发这些问题的原因在于,需求文档书写不规范,自然语言表达存在歧义,不同人有不同理解。

目前的自动化建模方法,需要在需求编写阶段,按照一定的结构和句式编写需求,格式死板,句式单一,难以表达复杂丰富的需求。每一套解析规则,仅仅能解决一种编写风格的需求文档。且句式发生变化时,解析规则也需要发生相应的变化,可用性低。

因此,通过自动校验和解析需求文档的方法,首先能够判断一篇需求文档中的语句是否和图元素提取相关,能够自动解析出Uml图元素,避免人工分析不准确、不全面的问题,提高需求文档分析的效率;同时解决传统的自动化建模方法不够一般化的缺陷。

自然语言处理是使用机器处理人类语言的理论和技术。自然语言处理将语言作为计算对象来研究相应的算法,其目标是通过自然语言的形式与机器系统进行人机交互,从而实现更高效和便捷的信息管理。自然语言处理的关键是让计算机“理解”自然语言。

对于自动生成Uml用例图(由图元素组成)方法,目前国内外存在一些自动解析工具。大部分国外解析工具仅仅适用于英文,对于中文需求文档并不适用。国内的自动解析工具,只能解析结构化的需求文档,对于半结构化或者不符合规范的文档,无法处理。

术语解释:

图元素:即生成用例图所必须的元素,例如“用户”“操作”等元素。

文本认知:主要是用计算机实现自动检测文本中是否存在已知的知识点类型,以及这些知识点之间的逻辑关系。即对文本的词语、句子的分析理解以及、对句子间逻辑关系的掌握,以及对整篇文章主题的理解。

发明内容

为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种基于文本认知的自动分析建模方法、系统、装置及介质。

本发明所采用的技术方案是:

一种基于文本认知的自动分析建模方法,包括以下步骤:

获取文档,对所述文档中的语句进行筛选,获取与图元素提取相关的语句;

根据预先定义的规则构建领域字典;

结合构建获得的领域字典,采用依存句法分析工具对与图元素提取相关的语句进行语义分析,获得语义分析结果;

制定基于语义分析的图元素提取规则;

根据制定的提取规则对语义分析结果提取图元素;

按照用例图的方式对提取获得的图元素进行存储。

进一步,所述对所述文档中的语句进行筛选,获取与图元素提取相关的语句,包括:

获取用于训练模型的训练集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011437720.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top