[发明专利]敏感信息识别方法、系统、可读存储介质及计算设备在审
| 申请号: | 202211401061.X | 申请日: | 2022-11-09 |
| 公开(公告)号: | CN115993972A | 公开(公告)日: | 2023-04-21 |
| 发明(设计)人: | 李丰廷;郝新;刘焱 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F8/41 | 分类号: | G06F8/41;G06F21/62;G06F21/64 |
| 代理公司: | 上海东信专利商标事务所(普通合伙) 31228 | 代理人: | 李丹;杨丹莉 |
| 地址: | 310063 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 敏感 信息 识别 方法 系统 可读 存储 介质 计算 设备 | ||
1.一种敏感信息识别方法,包括步骤:
获取待识别代码;
确定所述待识别代码的语言类型;
根据所述待识别代码的语言类型,对所述待识别代码进行语法树变换,生成所述待识别代码对应的语法树;
根据所述语法树,提取所述待识别代码中与字面量相关的符号表,并确定所述符号表中的变量、函数、类、常量和注释之间的关系;
采用预设的数据结构表征所述符号表中的变量、函数、类、常量和注释之间的关系,其中,针对不同语言类型的待识别代码预设的数据结构相同;
针对每个字面量,根据所述数据结构,确定该字面量在所述待识别代码中的使用场景,并得到该字面量在所述使用场景中的相关信息;
针对每个字面量,根据该字面量及其在所述使用场景中的相关信息对该字面量是否为敏感信息进行识别。
2.根据权利要求1所述的敏感信息识别方法,采用Antlr对所述待识别代码进行语法树变换。
3.根据权利要求2所述的敏感信息识别方法,根据所述语法树,提取所述待识别代码中与字面量相关的符号表包括:
通过所述语法树的vistor机制执行字面量相关操作获取操作后的字面量,并通过所述语法树的listener机制提取与操作后的字面量相关的符号表。
4.根据权利要求1所述的敏感信息识别方法,根据所述语法树,提取所述待识别代码中与字面量相关的符号表,并确定所述符号表中的变量、函数、类、常量和注释之间的关系包括:
提取变量名、变量类型、赋值关联变量以及变量作用域字段,并生成唯一ID;
提取函数名、函数变量名以及内部使用的已定义函数和变量,并根据内部变量名和函数名定义函数功能分值,进而定义函数属性;
提取子类的子变量字段;
提取直接字面常量、待计算常量,并与变量表的唯一ID关联,获取变量表的关联变量名、函数调用、类调用以及方法调用作为meta信息;
对注释进行功能区分,分为代码片段和文字信息,对代码片段进行二次提取,文字信息直接接入富文本通用检测。
5.根据权利要求1所述的敏感信息识别方法,所述使用场景包括直接赋值、间接赋值、计算赋值、函数常量传参、函数变量传参、复杂计算赋值、语言特性、注释/富文本。
6.根据权利要求1所述的敏感信息识别方法,字面量在所述使用场景中的相关信息包括所述使用场景下与字面量关联的变量、函数、类以及字面量、变量、函数和类的作用。
7.根据权利要求1所述的敏感信息识别方法,采用正则匹配方法来识别每个字面量是否为敏感信息;和/或,
根据每个字面量在使用场景下的相关信息,采用关键词检索或神经网络模型判定每个字面量的功能,然后根据每个字面量的功能判断其是否为敏感信息。
8.一种敏感信息识别系统,包括相互数据通信的:
获取模块,设置为获取待识别代码;
判断模块,设置为确定待识别代码的语言类型;
语法树变换模块,设置为根据待识别代码的语言类型,对待识别代码进行语法树变换,生成待识别代码对应的语法树;
第一处理模块,设置为根据语法树,提取待识别代码中与字面量相关的符号表,并确定符号表中的变量、函数、类、常量和注释之间的关系;
第二处理模块,设置为采用预设的数据结构表征所述符号表中的变量、函数、类、常量和注释之间的关系,其中,针对不同语言类型的待识别代码预设的数据结构相同;
第三处理模块,设置为针对每个字面量,根据数据结构,确定该字面量在待识别代码中的使用场景,并得到该字面量在所述使用场景中的相关信息;
识别模块,设置为针对每个字面量,根据该字面量及其在使用场景中的相关信息对该字面量是否为敏感信息进行识别。
9.根据权利要求8所述的敏感信息识别系统,所述语法树变换模块采用Antlr对所述待识别代码进行语法树变换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211401061.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





