[发明专利]自动生成编程规范问题答案的系统及方法在审

专利信息
申请号: 201910717702.4 申请日: 2019-08-05
公开(公告)号: CN112328800A 公开(公告)日: 2021-02-05
发明(设计)人: 吴秦月;杜天蛟;曹峻铭;李威;沈备军;陈雨亭 申请(专利权)人: 上海交通大学
主分类号: G06F16/36 分类号: G06F16/36;G06F8/33;G06F16/332
代理公司: 上海交达专利事务所 31201 代理人: 王毓理;王锡麟
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自动 生成 编程 规范 问题 答案 系统 方法
【说明书】:

一种自动生成编程规范问题答案的系统及方法,包括:子图匹配模块、机器阅读理解模块和学习排序模块,本发明通过构建编程规范知识图谱,通过子图匹配模块将自然语言问题转换为符合SPARQL协议的语句,利用编程规范知识图谱中结构化的信息查询得到候选答案。再通过机器阅读理解模块从自然语言问题中选取所有的名词、名词短语和主语,将这些词标记为关键词,使用Apache Solr引擎搜索得到最相关的10个自然段,并且使用基于TF‑IDF的算法对搜索得到的自然段进行打分,再对每个自然段使用训练好的深度学习模型得到候选答案,最后通过学习排序模块对候选答案进行合并生成新的候选答案,然后使用逻辑回归分类器按照正确的概率对新的候选答案进行排序。

技术领域

本发明涉及一种人工智能语义识别领域的技术,具体涉及一种自动生成编程规范问题答案的系统及方法。

背景技术

近年来,编程规范在软件质量保障中扮演了越来越重要的角色。编程规范是一系列的代码准则,帮助软件开发者提高代码的可读性、可维护性和可重用性。当软件开发者遇到编程规范相关的问题时,可以查询编程规范文档。然而一条编程规范可能会出现在多份编程规范文档中,并且每份编程规范文档的内容可能是不同的。因此,软件开发者需要查询或浏览多份文档才能获得想要的信息,十分繁琐。问答机器人系统能够自动生成用户提出的问题的答案,而现有的问答机器人系统并没有结合编程规范领域知识,因此很难高效理解软件开发者提出的关于编程规范的问题并给出正确的回答。

发明内容

本发明针对现有问答机器人系统编程规范领域知识利用不充分、用户意图理解不精确等缺陷,提出一种自动生成编程规范问题答案的系统及方法,并通过结合知识图谱和机器阅读理解技术,充分利用编程规范领域知识,更精确地理解用户意图,从而提高了自动生成编程规范问题答案的准确性。

本发明是通过以下技术方案实现的:

本发明涉及一种自动生成编程规范问题答案的系统,包括:子图匹配模块、机器阅读理解模块和学习排序模块,其中:子图匹配模块采集自然语言问题并转换为符合SPARQL(SPARQL Protocol and RDF Query Language)协议的语句,利用编程规范知识图谱中结构化的信息查询得到候选答案;机器阅读理解模块使用深度学习模型自动理解非结构化文本,预测得到候选答案;学习排序模块将子图匹配模块和机器阅读理解模块得到的候选答案合并,使用逻辑回归分类器对候选答案按照正确的概率进行排序。

所述的自然语言问题包括但不限于:寻找某条编程规范的属性、根据条件寻找某条适用的编程规范等。

本发明涉及上述系统的编程规范问题答案自动生成方法,包括以下步骤:

步骤1)构建编程规范知识图谱,具体为:基于编程规范知识图谱的本体,收集书籍以及各种组织公开的编程规范文档,将其整理存储为编程规范知识图谱中的三元组。

步骤2)通过子图匹配模块识别出自然语言问题中的节点,然后使用StanfordCoreNLP工具构建语法依赖树,根据识别出的节点集合和构建的语法依赖树生成查询子图Qu,根据Qu的内容和结构生成SPARQL查询语句,查询知识图谱得到候选答案。

步骤3)通过机器阅读理解模块从自然语言问题中选取所有的名词、名词短语和主语,将这些词标记为关键词,使用Apache Solr引擎搜索得到最相关的10个自然段,并且使用基于TF-IDF的算法对搜索得到的自然段进行打分,再对每个自然段使用训练好的深度学习模型得到候选答案。

步骤4)学习排序模块对步骤2和步骤3产生的候选答案进行合并生成新的候选答案,然后使用逻辑回归分类器按照正确的概率对新的候选答案进行排序。

所述的编程规范知识图谱包括:结构化数据和非结构化数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910717702.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top