[发明专利]数据文本化方法、装置、设备及存储介质有效
申请号: | 202110731473.9 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113434507B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 吴灿桂;杨雄威;李奕锴 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 文本 方法 装置 设备 存储 介质 | ||
本申请提供一种数据文本化方法、装置、设备及存储介质,其中,该方法以预设知识库为基础,通过对数据表的切片分割,进而,使用知识库中的相应数据项结构特征和数据项评判规则提取不同维度、层次的关键信息,获取数据表中隐藏的深层核心信息数据,生成相应的数据元组后将其进行聚合,最终生成信息文本,其中无需人工参与,解决了现有方法依赖分析人员个人经验与知识的问题。而且,本申请实施例能够通过不同的表数据切片,提取不同维度大小下的数据表关键信息,并在进行数据量压缩后生成文本,在提高数据分析人员的工作效率的同时,突破了其他数据文本生成的固化与冗余局限,使生成的文本更加凝练与专业。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据文本化方法、装置、设备及存储介质。
背景技术
随着企业业务的发展,企业相关的营业数据表数据量日渐增多,数据庞杂且难以直接观测得出结论,而相关决策者需要的是及时获取其中凝练的关键信息和结论,以用于做出相应决策,因此,数据文本化应运而生。
数据文本化是为数据表提供一种清晰明确的数据表述方式,能够让数据更易于理解和接受,并将其应用于企业生产管理活动的决策之中。现有对数据表进行文本化的方法主要由专业人员对数据表进行分析提炼后得出文本结论或者直接使用文本生成系统进行固化的计算,通过模板生成文字。
然而,上述对数据表进行文本化的方式比较依赖于分析人员的个人经验与知识,或者由于文本生成过于固化,使最终生成的文本容易包含数据表中的冗余信息,参考价值较低。
发明内容
为解决现有技术中存在的问题,本申请提供一种数据文本化方法、装置、设备及存储介质。
第一方面,本申请实施例提供一种数据文本化方法,该方法包括如下步骤:
获取目标数据表,并对所述目标数据表中的字段进行分割,获得分割字段;
将所述分割字段与预设知识库中的数据项结构特征进行匹配,获得所述目标数据表的数据项属性列、数据项对象列和数据项特征列;
基于所述数据项属性列、所述数据项对象列、所述数据项特征列,以及所述预设知识库中的数据评判规则,进行数据表关键信息提取,获得所述目标数据表对应的数据元组;
对所述数据元组进行同类聚合,并根据同类聚合结果,确定所述目标数据表对应的数据文本。
在一种可能的实现方式中,所述基于所述数据项属性列、所述数据项对象列、所述数据项特征列,以及所述预设知识库中的数据评判规则,进行数据表关键信息提取,获得所述目标数据表对应的数据元组,包括:
获取预设用户需求,并根据所述预设用户需求,从所述数据项属性列、所述数据项对象列和所述数据项特征列中,确定要点数据;
基于所述数据评判规则和所述要点数据,进行数据表关键信息提取,获得所述目标数据表对应的数据元组。
在一种可能的实现方式中,所述对所述目标数据表中的字段进行分割,获得分割字段,包括:
确定所述目标数据表的最小分割单元;
基于所述最小分割单元,对所述目标数据表中的字段进行最小颗粒分割,获得所述分割字段。
在一种可能的实现方式中,所述数据项结构特征包括多个预设字段的数据项属性列、数据项对象列和数据项特征列。
所述将所述分割字段与预设知识库中的数据项结构特征进行匹配,获得所述目标数据表的数据项属性列、数据项对象列和数据项特征列,包括:
将所述分割字段与所述多个预设字段的数据项属性列、数据项对象列和数据项特征列进行匹配,获得所述目标数据表的数据项属性列、数据项对象列和数据项特征列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110731473.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:蓝牙通信方法及装置
- 下一篇:一种DC-DC变换器及其控制策略
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置