[发明专利]一种将自然语言转化为程序代码的方法及系统在审
申请号: | 202011212608.2 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112306497A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 高炼 | 申请(专利权)人: | 高炼 |
主分类号: | G06F8/41 | 分类号: | G06F8/41;G06N3/08 |
代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 王珍 |
地址: | 431700 湖北省天*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然语言 转化 程序代码 方法 系统 | ||
本发明提出了一种将自然语言转化为程序代码的方法及系统,涉及深度学习领域。一种将自然语言转化为程序代码的方法包括:对输入的源语言进行预处理,提取源语言中与目标代码直接有关的关键信息;根据深度学习模型提取源语言的特征向量,并将源语言解析成语法树;在预构资源库中为源语言检索出可能匹配的若干个资源;对检索到的中间表示作出可能的转换变为相互关联的模板。其创新性地视自然语言转化为程序代码的过程为机器学习与信息检索的不确定性问题。此外本发明还提出一种将自然语言转化为程序代码系统,包括:预处理模块、分析模块、检索模块、转换模块、连接模块以及转化模块。
技术领域
本发明涉及深度学习领域,具体而言,涉及一种将自然语言转化为程序代码的方法及系统。
背景技术
计算机语言在计算机领域内应用范围广泛,但是,随着计算机语言的高速发展,其种类越来越多,并且计算机语言的复杂度也较高,掌握并达到精通的程度比较困难。
在越来越多的计算机应用中要求相关产品的产出既要高效又要周期短。对这些应用的实现,要求应用设计者和实施者具有较高的计算机语言水平。而在现实环境中这往往意味着需要付出更多的成本用于编码和设计培训的投入,并且导致规模性的实施相对困难。
计算机语言的使用风格与自然语言差别巨大,计算机语言表述信息比自然语言更加精确,但是复杂度也相对更高。对计算机语言从掌握到精通往往需要较高的成本投入,并且实现周期过长。
发明内容
本发明的目的在于提供一种将自然语言转化为程序代码的方法,其能够创新性地视自然语言转化为程序代码的过程为机器学习与信息检索的不确定性问题,定义了这一问题中的评价标准,以使得其能够采用其他问题中常见的衡量指标进行评估。
本发明的另一目的在于提供一种将自然语言转化为程序代码系统,其能够运行一种将自然语言转化为程序代码的方法。
本发明的实施例是这样实现的:
第一方面,本申请实施例提供一种将自然语言转化为程序代码的方法,其包括对输入的源语言进行预处理,提取源语言中与目标代码直接有关的关键信息;根据深度学习模型提取源语言的特征向量,并将源语言解析成语法树;在预构资源库中为源语言检索出可能匹配的若干个资源;对检索到的中间表示作出可能的转换变为相互关联的模板;将正确的一套模板的空槽填入对应的代码块与变量,得到当前句子对应的一套相关联的代码块,并与其他句子的代码块以同样方式连接,形成目标代码的整体的图状数据结构;将图状数据结构转化为最终的目标代码。
在本发明的一些实施例中,在上述对输入的源语言进行预处理,提取源语言中与目标代码直接有关的关键信息之后包括:将源语言进行分割后,依次处理每个单元,并将源语言处理成适合深度学习模型处理的标准形式。
在本发明的一些实施例中,上述根据深度学习模型提取源语言的特征向量,并将源语言解析成语法树包括:使用训练好的深度学习模型处理源语言,根据源语言语法上的构成关系将其分解并组织成更易于处理的树状结构,并提取句子、子句、词组、单词的语义特征向量。
在本发明的一些实施例中,上述在预构资源库中为源语言检索出可能匹配的若干个资源包括:迭代处理语法树,并在预构资源库中检索可能与当前树节点对应的源语言成分匹配的源语言模式;源语言模式被映射成代码模板或变量模板与目标语言有关的表示。
在本发明的一些实施例中,上述还包括源语言模式被映射成一阶谓词逻辑表示、lambda表达式表示或程序代码数据结构的表示独立于源语言与目标语言的中间表示。
在本发明的一些实施例中,上述对检索到的中间表示作出可能的转换变为相互关联的模板包括:对检索到的中间表示作出可能的转换变为相互关联的模板,模板中选择能够相互关联并且能够覆盖原源语言的一组可能性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高炼,未经高炼许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011212608.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:PTA氧化残渣回收工艺
- 下一篇:电子膨胀阀控制方法、系统及制冷系统