[发明专利]基于文本认知的自动分析建模方法、系统、装置及介质在审
| 申请号: | 202011437720.6 | 申请日: | 2020-12-10 |
| 公开(公告)号: | CN112579444A | 公开(公告)日: | 2021-03-30 |
| 发明(设计)人: | 黄翰;刘雨瑶;王业超;黄俊聪 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F40/30;G06F40/242 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 常柯阳 |
| 地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文本 认知 自动 分析 建模 方法 系统 装置 介质 | ||
本发明公开了一种基于文本认知的自动分析建模方法、系统、装置及介质,其中方法包括:获取文档,对所述文档中的语句进行筛选,获取与图元素提取相关的语句;根据预先定义的规则构建领域字典;结合构建获得的领域字典,采用依存句法分析工具对与图元素提取相关的语句进行语义分析,获得语义分析结果;制定基于语义分析的图元素提取规则;根据制定的提取规则对语义分析结果提取图元素;按照用例图的方式对提取获得的图元素进行存储。本发明能够实现自动化的需求分析建模方法,能够自动根据需求文档,分析出相应的Uml用例图,从而提高需求分析建模的准确率和软件开发的效率,可广泛应用于自然语言处理、软件工程需求分析领域。
技术领域
本发明涉及自然语言处理、软件工程需求分析领域,尤其涉及一种基于文本认知的自动分析建模方法、系统、装置及介质。
背景技术
软件工程需求分析过程是软件开发过程的重要环节,能否准确的根据需求文档,了解用户的真正意图,识别每个子系统的用户和功能需求至关重要。然而,通过传统的人工识别方式,存在着不准确、不全面、有歧义的问题。引发这些问题的原因在于,需求文档书写不规范,自然语言表达存在歧义,不同人有不同理解。
目前的自动化建模方法,需要在需求编写阶段,按照一定的结构和句式编写需求,格式死板,句式单一,难以表达复杂丰富的需求。每一套解析规则,仅仅能解决一种编写风格的需求文档。且句式发生变化时,解析规则也需要发生相应的变化,可用性低。
因此,通过自动校验和解析需求文档的方法,首先能够判断一篇需求文档中的语句是否和图元素提取相关,能够自动解析出Uml图元素,避免人工分析不准确、不全面的问题,提高需求文档分析的效率;同时解决传统的自动化建模方法不够一般化的缺陷。
自然语言处理是使用机器处理人类语言的理论和技术。自然语言处理将语言作为计算对象来研究相应的算法,其目标是通过自然语言的形式与机器系统进行人机交互,从而实现更高效和便捷的信息管理。自然语言处理的关键是让计算机“理解”自然语言。
对于自动生成Uml用例图(由图元素组成)方法,目前国内外存在一些自动解析工具。大部分国外解析工具仅仅适用于英文,对于中文需求文档并不适用。国内的自动解析工具,只能解析结构化的需求文档,对于半结构化或者不符合规范的文档,无法处理。
术语解释:
图元素:即生成用例图所必须的元素,例如“用户”“操作”等元素。
文本认知:主要是用计算机实现自动检测文本中是否存在已知的知识点类型,以及这些知识点之间的逻辑关系。即对文本的词语、句子的分析理解以及、对句子间逻辑关系的掌握,以及对整篇文章主题的理解。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种基于文本认知的自动分析建模方法、系统、装置及介质。
本发明所采用的技术方案是:
一种基于文本认知的自动分析建模方法,包括以下步骤:
获取文档,对所述文档中的语句进行筛选,获取与图元素提取相关的语句;
根据预先定义的规则构建领域字典;
结合构建获得的领域字典,采用依存句法分析工具对与图元素提取相关的语句进行语义分析,获得语义分析结果;
制定基于语义分析的图元素提取规则;
根据制定的提取规则对语义分析结果提取图元素;
按照用例图的方式对提取获得的图元素进行存储。
进一步,所述对所述文档中的语句进行筛选,获取与图元素提取相关的语句,包括:
获取用于训练模型的训练集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011437720.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:低温气瓶
- 下一篇:一种防爆行程开关的触动机构





