[发明专利]一种财报风险识别方法、装置、电子设备及存储介质在审
| 申请号: | 202310243791.X | 申请日: | 2023-03-14 |
| 公开(公告)号: | CN116307712A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 姜超;钟坚文;李学勇;何海清;郝寸平;周俊;张皓东;郭正斌;刘鹏飞 | 申请(专利权)人: | 渤海银行股份有限公司 |
| 主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q40/12;G06F18/214;G06N3/048;G06N3/09 |
| 代理公司: | 北京植众德本知识产权代理有限公司 16083 | 代理人: | 高秀娟 |
| 地址: | 300012 *** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 风险 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种财报风险识别方法、装置、电子设备及存储介质,该方法包括:获取财报数据集,对财报数据集进行预处理和数据清洗,构造特征矩阵,对不同企业在对应时间维度上的财报数据进行对比学习处理,得到每个企业在不同时间维度上的隐含特征矩阵,然后构建监督学习模型,从无标注样本集中筛选出已有规则无法检测出的目标样本,接着再从目标样本中筛选出疑似粉饰财报数据,对疑似粉饰财报数据进行归因分析,得到粉饰财报和粉饰财报对应的粉饰行为,最后基于粉饰财报和粉饰行为更新财报粉饰规则库。本申请能够较高程度地识别财务粉饰情况。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种财报风险识别方法、装置、电子设备及存储介质。
背景技术
财务报表的内容要如实全面反映企业的财务状况和经营成果,满足相关利益者的信息需求,要保证向报表使用者提供的各项数据真实可靠。然而目前财务报表粉饰现象严重,并且粉饰的程度也比较高。这些不真实的会计报表传递了错误的信息,迷惑了报表的预期使用者,依此作出错误的决策,导致财务风险加大,资金受损;同时也会扰乱经济秩序,导致税收流失、财政和银行资金蒙受损失。
因此必须认真分析财务报表粉饰行为产生的原因,最大程度的识别出财务粉饰的情况,现有技术中缺少相应的解决手段。
发明内容
有鉴于此,本申请实施例提供了一种财报风险识别方法、装置、电子设备及存储介质,能够较高程度地识别财务粉饰情况。
本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种财报风险识别方法,包括以下步骤:
获取财报数据集,并对所述财报数据集进行预处理,得到标注样本集和无标注样本集,其中,所述标注样本集表示已经确定是否具有粉饰的财报数据,所述无标注样本集表示不能确定是否具有粉饰的财报数据;
对所述无标注样本集进行数据清洗,并基于清洗后的所述无标注样本集构造特征矩阵,其中,所述特征矩阵用于表示每个企业在不同时间维度上的所述财报数据;
基于所述特征矩阵,对不同企业在对应时间维度上的所述财报数据进行对比学习处理,得到每个企业在不同时间维度上的隐含特征矩阵,其中,所述隐含特征矩阵中包括用于描述是否具有粉饰的区分度特征;
基于所述标注样本集和所述每个企业在不同时间维度上的隐含特征矩阵构建监督学习模型,并通过所述监督学习模型从所述无标注样本集中筛选出已有规则无法检测出的目标样本;
从所述目标样本中筛选出疑似粉饰财报数据,对所述疑似粉饰财报数据进行归因分析,得到每个疑似粉饰财报数据存在粉饰的概率,并根据所述概率得到粉饰财报和所述粉饰财报对应的粉饰行为;
基于所述粉饰财报和所述粉饰行为更新财报粉饰规则库。
在一种可能的实施方式中,所述标注样本集包括正样本集和负样本集,所述对所述财报数据集进行预处理,得到标注样本集和无标注样本集,包括:
从目标数据源中采集至少一条财报数据组成所述财报数据集;
将已经确定无粉饰的所述财报数据确定为所述正样本集、将已经确定有粉饰的所述财报数据确定为所述负样本集以及将不能确定是否具有粉饰的所述财报数据确定为所述无标注样本集。在一种可能的实施方式中,所述方法还包括:
在一种可能的实施方式中,所述基于清洗后的所述无标注样本集构造特征矩阵,包括:
根据每个企业的企业信息和行业信息构建每个企业对应的第一特征矩阵,其中,所述企业信息包括企业基本信息和企业经营信息,所述行业信息包括行业基本信息和行业经营信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渤海银行股份有限公司,未经渤海银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310243791.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可折叠压缩收纳的围油栏
- 下一篇:内存性能损耗测试方法和装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





