[发明专利]一种面向智能数据可视化的对话式问答实现方法有效
申请号: | 202110399195.1 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113111158B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 李齐良;李舒琴 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/242;G06F16/338;G06F16/34 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 智能 数据 可视化 对话 问答 实现 方法 | ||
本发明公开了一种面向智能数据可视化的对话式问答实现方法,其按如下步骤进行:第一步:通过数据库收集、分析方法的SQL函数集构建、问题创建与SQL、可视化方案标注、SQL语句审阅、问题文本审阅、整体审阅来构建数据集;第二步:在数据集的基础上,通过具体问题的数学化来构造问题;第三步:建立将文本转化为分析型SQL,文本可视化方案提取的模型框架;第四步:建立自动评估与人类评估的评估方案。本发明能够构建一个更加支持分析的数据问答系统,相对于普通BI数据问答系统能够支持更多的分析方法。
技术领域
本发明属于人工智能技术领域,具体涉及一种面向商务智能数据可视化的对话式知识问答实现方法。
背景技术
随着人工智能(AI)技术的进步,以及大数据的支撑,人工智能(AI)技术开始广泛的应用于各个领域,比如图像识别、物体检测、图像生成、机器翻译、知识图谱、对话问答等领域。AI技术在这些领域的运用可以帮助人们减少重复性劳动,提高工作效率并辅助人们进行创造。在商务智能领域,人们通过对原始数据进行转换,应用分析算法来获得见解,进而帮助决策。目前分析者得到一个分析结果通常需要经历如下的步骤:了解数据结构,转换原始数据,选择分析方法或自行撰写分析函数,制定可视化展示方案,得到结果。而现有技术存在的缺陷是,需要花费大量的时间,并且过程难以复制,造成了很多重复劳动。
发明内容
基于上述现状,研发一种技术方案可以帮助简化步骤,那么分析的复杂性可以被大大简化,分析者可以更加聚焦于了解数据背后的见解,从数据中获得更多的知识,因此,本发明提供了一种面向智能数据可视化的对话式问答实现方法,其包括基于自然语言的算法,进一步为系统问答式知识的图谱可视化打下基础。
本发明采取以下技术方案:
一种面向智能数据可视化的对话式问答实现方法,即实现商务智能分析、及自然语言转化为SQL(结构化查询语言)以及自动可视化。将通过商务智能分析方法来构建一个新的包含常见分析方法的NL2SQL数据集(NL2BISQL数据集),然后利用本发明中的模型,来实现面向商务智能可视化的问答过程,返回可视化结果作为回答。其按如下步骤进行:
第一步:数据集构建:通过数据库收集、分析方法的SQL(结构化查询语言)函数集构建、问题创建与SQL、可视化方案标注、SQL语句审阅、问题文本审阅、整体审阅来构建数据集;
第二步:问题构造:在数据集的基础上,通过具体问题的数学化来构造问题;
第三步:模型框架:建立将文本转化为分析型SQL,文本可视化方案提取的模型框架;
第四步:评估方案:自动评估与人类评估的评估方案建立。
进一步的,第一步具体如下:
本发明在Spider数据集的基础上进行扩展。其中包含200个数据库,其中每个数据库平均含有5.1个表格。经过检查,虽然该数据集可以泛化至不同的领域,再增加一些商业场景下的数据,能够更直接的验证商务智能场景中的应用效果。
本发明采用描述性分析(descriptive statistic)与推理统计(inferentialstatistics)来收集常用分析方法,并构建一种机制使使用者能够根据需要扩展。确定了分析方法后,制定默认的可视化方案,最后形成分析方法的SQL函数集。
在拥有分析方法的SQL函数集后,则可开始生成文本及对应的SQL、及可视化。其过程为:首先针对每个数据集生成20-30个SQL,这些SQL的生成遵循如下规则:1)覆盖50%的分析方法;2)涉及数据库的每一个表格;3)自动根据表格属性生成SQL;4)由于对于同一结果,用不同的SQL表示,规定SQL协议,生成时须符合协议。
对于具有多个可能的SQL翻译的问题,审阅者应仔细检查是否根据协议正确选择了SQL标签。然后,审阅者检查当前数据库中的所有SQL语句是否覆盖50%分析方法,是否涉及数据库中所有表格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110399195.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置