[发明专利]一种基于自然语言预训练模型(BERT)的软件功能点识别方法在审
申请号: | 202110386325.8 | 申请日: | 2021-04-09 |
公开(公告)号: | CN113127060A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 仲兆祥;袁华新;张笑闻;郭琼琼;朱玉 | 申请(专利权)人: | 中通服软件科技有限公司 |
主分类号: | G06F8/77 | 分类号: | G06F8/77;G06F40/295;G06F40/289;G06F40/284;G06F40/268;G06F40/211;G06F40/216 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 李崧岩 |
地址: | 100000 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 训练 模型 bert 软件 功能 识别 方法 | ||
1.一种功能点识别方法,其特征在于,包括以下步骤:
获取至少一个需求描述语句;
将所述至少一个需求描述语句输入已训练完成的命名实体识别模型中得到至少一个命名实体;
对所述至少一个需求描述语句进行分词处理得到分词集,所述分词集包括至少一个分词;
将所述至少一个命名实体和分词集中的分词进行合并,对合并后的结果进行词性标注;
对词性标注结果进行处理识别出功能点。
2.根据权利要求1所述的一种功能点识别方法,其特征在于,所述对词性标注结果进行处理识别出功能点包括:
对词性标注的结果进行依存句法分析,得到词与词之间的依存关系;
根据依存关系识别功能点。
3.根据权利要求1所述的一种功能点识别方法,其特征在于,所述命名实体识别模型包括依次信号连接的双向预训练语言模型Bert和条件随机场CRF。
4.根据权利要求3所述的一种功能点识别方法,其特征在于,所述双向预训练语言模型Bert的训练方法包括:
利用训练集对双向预训练语言模型Bert进行预训练,所述训练集中包括多领域的语料数据,所述多领域的语料数据中的每个语料数据包括至少一个需求描述语句;
利用一专业领域的至少一语料数据对预训练后的双向预训练语言模型Bert进行调整,所述专业领域的至少一语料数据中的每个语料数据包括至少一个该专业领域的需求描述语句。
5.根据权利要求1所述的一种功能点识别方法,其特征在于,所述功能点包括内部逻辑文件ILF、外部接口文件EIF、外部输入EI、外部输出EO、外部查询EQ中至少一种。
6.一种软件研发成本预估方法,其特征在于,包括以下步骤:
采用上述权利要求1-5任意一种功能点识别方法识别出软件需求性文档中的功能点;
基于功能点、行业基准数据计算软件研发成本。
7.一种功能点识别设备,其特征在于,包括依次通信连接的语句获取模块、命名实体获取模块、合并模块、词性标注模块、功能点识别模块,所述语句获取模块、合并模块之间还通信连接有分词模块;
所述语句获取模块,用以获取至少一个需求描述语句;
所述命名实体获取模块,用于将所述至少一个需求描述语句输入已训练完成的命名实体识别模型中得到至少一个命名实体;
所述分词模块,用以对所述至少一个需求描述语句进行分词处理得到分词集,所述分词集包括至少一个分词;
所述合并模块,用以将所述至少一个命名实体和分词集中的分词进行合并;
所述词性标注模块,用以对合并后的结果进行词性标注;
所述功能点识别模块,用以对词性标注结果进行处理识别出功能点。
8.一种软件研发成本预估设备,其特征在于,包括依次通信连接的功能点识别设备、成本核算模块,
所述功能点识别设备为权利要求7所述的功能点识别设备;
所述成本核算模块,用于根据功能点、行业基准数据计算软件研发成本。
9.一种计算机设备,其特征在于,包括通信相连的存储器和处理器,其中,所述存储器用于存储计算机程序,所述处理器用于读取所述计算机程序,执行如权利要求1-5任意一项所述的功能点识别方法或执行如权利要求6所述的软件研发成本预估方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1-5任意一项所述的功能点识别方法或执行如权利要求6所述的软件研发成本预估方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通服软件科技有限公司,未经中通服软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110386325.8/1.html,转载请声明来源钻瓜专利网。