[发明专利]一种基于自然语言理解的工业数据可视化分析方法在审
申请号: | 202211326769.3 | 申请日: | 2022-10-27 |
公开(公告)号: | CN115544157A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 巩书凯;王立东;邓俊;陈磊;姜仁杰;卢仁谦 | 申请(专利权)人: | 重庆忽米网络科技有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F16/25;G06F16/242;G06F16/215;G06F16/28;G06Q50/04 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 黄河 |
地址: | 400041 重庆市高新*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 理解 工业 数据 可视化 分析 方法 | ||
1.一种基于自然语言理解的工业数据可视化分析方法,其特征在于,包括以下步骤:
S1、获取待使用的工业数据;
S2、对工业数据进行处理,得到有效数据并存入预设的数据仓库;
S3、根据有效数据之间的关系和结构建立数据分析模型,用于对数据仓库内的有效数据进行数据分析;
S4、建立自然语言解析模型并进行训练;
S5、接收到通过自然语言输入的数据需求后,用自然语言解析模型对数据需求进行解析;
S6、通过数据分析模型对自然语言解析模型的解析结果进行分析处理,判断数据仓库内是否存在对应的数据;
S7、结合自然语言解析结果及数据分析模型的分析处理结果,生成数据可视化分析结果。
2.如权利要求1所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:S2中,对工业数据的处理包括数据清洗和数据转换。
3.如权利要求2所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:所述数据清洗包括重复数据处理;所述重复数据处理包括,整理出工业数据中的重复数据后,保留重复数据中的一份数据并删除其余数据。
4.如权利要求2所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:所述数据清洗还包括缺失数据处理;所述缺失数据处理包括删除处理、替换处理和插补处理;所述删除处理包括,当工业数据的某变量的数据中,存在缺失的观测数据所占比例小于预设的最低比值时删除存在缺失的观测数据,当存在缺失的观测数据所占比例大于预设的最高比值时删除该变量的所有数据;所述替换处理包括,当工业数据的某变量数据中,存在缺失的观测数据所占比例大于等于预设的最低比值且小于等于预设的最高比值时,用预设的常数替换缺失数据;所述插补处理包括,当工业数据的某变量数据中,存在缺失的观测数据所占比例大于等于预设的最低比值且小于等于预设的最高比值时,指根据其他非缺失的变量或观测来预测缺失值。
5.如权利要求2所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:所述数据清洗还包括异常值处理;所述异常值处理包括删除异常值、平均值替代或视为缺失值。
6.如权利要求2所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:数据转换包括通过脚本进行数据转换或通过ETL工具进行数据转换。
7.如权利要求1所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:S3中,所述数据分析模型为星型模型。
8.如权利要求1所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:S4中,所述自然语言解析模型包括编码层、交互层和输出层;编码层用于对输入自然语言的文本进行分词和向量化处理后加入编码信息,并采用上下文编码获得每个单词在具体语境中的含义;交互层用于对编码层的输出结果进行交互处理;输出层用于按预设要求生成自然语言的解析结果。
9.如权利要求1所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:S6中,若数据仓库内存在对应的数据,则数据分析模型匹配出对应的数据,作为分析处理结果。
10.如权利要求9所述的基于自然语言理解的工业数据可视化分析方法,其特征在于:S6中,若数据仓库内存在对应的数据,则数据分析模型反馈预设的查询失败信息作为分析处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆忽米网络科技有限公司,未经重庆忽米网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211326769.3/1.html,转载请声明来源钻瓜专利网。