[发明专利]审计数据处理方法及装置在审
| 申请号: | 202110774446.X | 申请日: | 2021-07-08 |
| 公开(公告)号: | CN113434639A | 公开(公告)日: | 2021-09-24 |
| 发明(设计)人: | 白盛楠;闫宏宇;陈文博;刘朋强;代琼琼;姚元伟 | 申请(专利权)人: | 中国银行股份有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王天尧;谷敬丽 |
| 地址: | 100818 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 审计 数据处理 方法 装置 | ||
1.一种审计数据处理方法,其特征在于,包括:
获取审计数据中的非结构化文本数据;
根据所述非结构化文本数据生成特征向量;
利用所述特征向量进行数据分析,得到第一维度数据;
根据所述非结构化文本数据确定第二维度数据;
将所述非结构化文本数据、所述第一维度数据和所述第二维度数据存储至审计平台,以利用所述审计平台进行审计数据处理。
2.根据权利要求1所述的方法,其特征在于,根据所述非结构化文本数据生成特征向量,包括:
根据所述非结构化文本数据建立专用词词库和无意义词词库;
利用所述专用词词库和所述无意义词词库对所述非结构化文本数据进行预处理,得到预处理结果;
根据所述预处理结果生成特征向量。
3.根据权利要求2所述的方法,其特征在于,根据所述预处理结果生成特征向量,包括:
利用词频逆文本频率指数方法计算第一向量;
利用skip-gram模型计算第二向量;
根据所述第一向量和所述第二向量生成特征向量。
4.根据权利要求3所述的方法,其特征在于,利用词频逆文本频率指数方法计算第一向量,包括:
根据所述预处理结果计算词频数据和逆文档频率数据;
根据所述逆文档频率数据计算类间分布数据;
根据所述词频数据、所述类间分布数据和位置因子数据计算第一向量。
5.根据权利要求1所述的方法,其特征在于,利用所述特征向量进行数据分析,包括:
利用所述特征向量进行关键词提取、关联分析、文本归类分析和相似性分析中的一种或几种数据分析。
6.一种审计数据处理装置,其特征在于,包括:
获取模块,用于获取审计数据中的非结构化文本数据;
特征模块,用于根据所述非结构化文本数据生成特征向量;
分析模块,用于利用所述特征向量进行数据分析,得到第一维度数据;
提取模块,用于根据所述非结构化文本数据确定第二维度数据;
存储模块,用于将所述非结构化文本数据、所述第一维度数据和所述第二维度数据存储至审计平台,以利用所述审计平台进行审计数据处理。
7.根据权利要求6所述的装置,其特征在于,所述特征模块,包括:
词库单元,用于根据所述非结构化文本数据建立专用词词库和无意义词词库;
预处理单元,用于利用所述专用词词库和所述无意义词词库对所述非结构化文本数据进行预处理,得到预处理结果;
生成单元,用于根据所述预处理结果生成特征向量。
8.根据权利要求7所述的装置,其特征在于,所述生成单元,具体用于:
利用词频逆文本频率指数方法计算第一向量;
利用skip-gram模型计算第二向量;
根据所述第一向量和所述第二向量生成特征向量。
9.根据权利要求8所述的装置,其特征在于,所述生成单元,具体用于:
根据所述预处理结果计算词频数据和逆文档频率数据;
根据所述逆文档频率数据计算类间分布数据;
根据所述词频数据、所述类间分布数据和位置因子数据计算第一向量。
10.根据权利要求6所述的装置,其特征在于,所述分析模块,具体用于:
利用所述特征向量进行关键词提取、关联分析、文本归类分析和相似性分析中的一种或几种数据分析。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一所述审计数据处理方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至5任一所述审计数据处理方法的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110774446.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种幕墙用烤瓷铝单板及制造工艺
- 下一篇:一种信息工程监理图纸存放装置





