[发明专利]一种财报风险识别方法、装置、电子设备及存储介质在审
| 申请号: | 202310243791.X | 申请日: | 2023-03-14 |
| 公开(公告)号: | CN116307712A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 姜超;钟坚文;李学勇;何海清;郝寸平;周俊;张皓东;郭正斌;刘鹏飞 | 申请(专利权)人: | 渤海银行股份有限公司 |
| 主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q40/12;G06F18/214;G06N3/048;G06N3/09 |
| 代理公司: | 北京植众德本知识产权代理有限公司 16083 | 代理人: | 高秀娟 |
| 地址: | 300012 *** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 风险 识别 方法 装置 电子设备 存储 介质 | ||
1.一种财报风险识别方法,其特征在于,包括以下步骤:
获取财报数据集,并对所述财报数据集进行预处理,得到标注样本集和无标注样本集,其中,所述标注样本集表示已经确定是否具有粉饰的财报数据,所述无标注样本集表示不能确定是否具有粉饰的财报数据;
对所述无标注样本集进行数据清洗,并基于清洗后的所述无标注样本集构造特征矩阵,其中,所述特征矩阵用于表示每个企业在不同时间维度上的所述财报数据;
基于所述特征矩阵,对不同企业在对应时间维度上的所述财报数据进行对比学习处理,得到每个企业在不同时间维度上的隐含特征矩阵,其中,所述隐含特征矩阵中包括用于描述是否具有粉饰的区分度特征;
基于所述标注样本集和所述每个企业在不同时间维度上的隐含特征矩阵构建监督学习模型,并通过所述监督学习模型从所述无标注样本集中筛选出已有规则无法检测出的目标样本;
从所述目标样本中筛选出疑似粉饰财报数据,对所述疑似粉饰财报数据进行归因分析,得到每个疑似粉饰财报数据存在粉饰的概率,并根据所述概率得到粉饰财报和所述粉饰财报对应的粉饰行为;
基于所述粉饰财报和所述粉饰行为更新财报粉饰规则库。
2.根据权利要求1所述的方法,其特征在于,所述标注样本集包括正样本集和负样本集,所述对所述财报数据集进行预处理,得到标注样本集和无标注样本集,包括:
从目标数据源中采集至少一条财报数据组成所述财报数据集;
将已经确定无粉饰的所述财报数据确定为所述正样本集、将已经确定有粉饰的所述财报数据确定为所述负样本集以及将不能确定是否具有粉饰的所述财报数据确定为所述无标注样本集。
3.根据权利要求1所述的方法,其特征在于,所述基于清洗后的所述无标注样本集构造特征矩阵,包括:
根据每个企业的企业信息和行业信息构建每个企业对应的第一特征矩阵,其中,所述企业信息包括企业基本信息和企业经营信息,所述行业信息包括行业基本信息和行业经营信息;
基于所述企业经营信息和所述行业经营信息的时间维度,对每个企业对应的所述第一特征矩阵进行衍生处理,得到每个企业对应的第二特征矩阵,并将每个企业对应的第二特征矩阵作为所述特征矩阵。
4.根据权利要求1所述的方法,其特征在于,所述基于所述特征矩阵,对不同企业在对应时间维度上的所述财报数据进行对比学习处理,得到每个企业在不同时间维度上的隐含特征矩阵,包括:
以企业为单位,选取任意企业任意季度的财报数据作为锚样本,将非锚样本所在企业的财报数据作为负样本,以及将选取的该企业其他季度的财报数据作为正样本;
基于每次选取的所述锚样本、所述负样本和所述正样本,对该次选取的所述正样本输入深度神经网络进行对比学习处理,并通过损失函数确定每个企业在不同时间维度上的所述区分度特征;
将所述区分度特征添加至所述特征矩阵,得到所述隐含特征矩阵。
5.根据权利要求1所述的方法,其特征在于,所述通过所述监督学习模型从所述无标注样本集中筛选出已有规则无法检测出的目标样本,包括:
将多层感知器作为所述监督学习模型,其中,所述多层感知器中神经元的激活函数为噪声线性整流函数;
将所述无标注样本集作为输入参数输入所述监督学习模型,得到粉饰行为概率;
将所述粉饰行为概率大于预设的第一阈值的财报数据确定为所述目标样本。
6.根据权利要求1所述的方法,其特征在于,所述从所述目标样本中筛选出疑似粉饰财报数据,包括:
确定所述目标样本所处的当前行业;
计算所述当前行业下已知的具有粉饰行为的财报数据占该行业下的总体样本的总体样本比例;
从所述目标样本中取目标数量的财报数据作为所述疑似粉饰财报数据,其中,所述目标数量为所述总体样本与所述总体样本比例的乘积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渤海银行股份有限公司,未经渤海银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310243791.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可折叠压缩收纳的围油栏
- 下一篇:内存性能损耗测试方法和装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





