[发明专利]一种基于NL2SQL技术的配电自动化图表生成方法在审
| 申请号: | 202011392258.2 | 申请日: | 2020-12-02 |
| 公开(公告)号: | CN112597273A | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 曾晓;陈蕾;杨坚;汤义勤;徐重酉;徐旭;韩威;黄俊;童力 | 申请(专利权)人: | 国网浙江省电力有限公司台州供电公司;国网浙江省电力有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31;G06F40/289;G06F40/211 |
| 代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 项军 |
| 地址: | 317000 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 nl2sql 技术 配电 自动化 图表 生成 方法 | ||
本发明涉及语义识别领域,尤其涉及一种基于NL2SQL技术的配电自动化图表生成方法,包括:获取语言信息;根据语言信息从数据库中匹配得到最佳匹配表;将语言信息通过数据预处理得到问题要素;将数据预处理得到的问题要素解析成数据结构;根据数据结构匹配最佳图表类型并生成该类型的图表。本发明能够根据需要自动获取数据并自动生成对应类型的图表。
技术领域
本发明涉及语义识别领域,尤其涉及一种基于NL2SQL技术的配电自动化图表生成方法。
背景技术
随电网服务型系统的不断完善,系统如浙江配电自动化Ⅳ区主站系统的数据规模和复杂度日益增大,数据分析人员从海量信息数据中找到合适有用的信息的难度日渐增加。重要信息或关键信息的获取往往需要依赖对系统功能模块熟悉的人员进行数据筛取和数据分析。因此,现有的数据筛取和数据分析需要大量的时间。
发明内容
为解决上述问题,本发明提出一种基于NL2SQL技术的配电自动化图表生成方法。
一种基于NL2SQL技术的配电自动化图表生成方法,包括:
获取语言信息;
根据语言信息从数据库中匹配得到最佳匹配表;
将语言信息通过数据预处理得到问题要素;
将数据预处理得到的问题要素解析成数据结构;
根据数据结构匹配最佳图表类型并生成该类型的图表。
优选的,所述根据语言信息从数据库中匹配得到最佳匹配表包括:
将数据库中表的字段名、枚举值、实体标签按字级别构建成倒排索引;
通过计算语言信息中问题与每个表的字段名、枚举值和标签的jaccard距离,当问题中包含与两个及以上的表相关的字段时,采用position_diff计算方式将问题中匹配得到的字段按顺序排列,并计算在倒排索引中记录的距离的差分序列之和;
进行到排序得到最佳匹配表。
优选的,所述通过计算语言信息中问题与每个表的字段名、枚举值和标签的jaccard距离包括:
其中,question是问题中字和实体标签的集合,table是表的字段名,invert_index是倒排索引。
优选的,所述采用position_diff计算方式将问题中匹配得到的字段按顺序排列包括:
优选的,所述根据语言信息从数据库中匹配得到最佳匹配表包括:
通过word2vec模型对词进行向量化,对问题进行分词;
在问题上使用长度为3的滑动窗口从左向右滑动,每滑动一次,计算窗口内的词的向量和预先设定的表向量之间的相似度;
每个窗口相似度的最大值为表的分数,以最终得出数值最大的为最佳匹配表。
优选的,所述将语言信息通过数据预处理得到问题要素包括:
对问题进行分词、词性标注、实体识别和依存句法分析。
优选的,所述数据结构包含需要查询的字段、查询结果数量、排序和分组要求。
优选的,所述根据数据结构匹配最佳图表类型并生成该类型的图表包括:
以维度和指标为条件设定规则以描述不同类型图表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司台州供电公司;国网浙江省电力有限公司,未经国网浙江省电力有限公司台州供电公司;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011392258.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钥匙插拔机构
- 下一篇:一种硫醚催化氧化制备砜的方法





