[发明专利]一种日志记录方法、计算机设备及存储介质有效
| 申请号: | 202010280035.0 | 申请日: | 2020-04-10 |
| 公开(公告)号: | CN111522708B | 公开(公告)日: | 2021-08-24 |
| 发明(设计)人: | 荣国平;黄国成;顾胜晖 | 申请(专利权)人: | 星环信息科技(上海)股份有限公司 |
| 主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F16/18;G06F16/35 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200233 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 日志 记录 方法 计算机 设备 存储 介质 | ||
1.一种日志记录方法,其特征在于,包括:
获取目标代码块;
从所述目标代码块中提取目标代码块特征;
将所述目标代码块特征输入至预先训练好的日志决策模型中,根据所述日志决策模型的输出结果判断是否需要在所述目标代码块中插入日志记录语句;
若是,则在所述目标代码块中插入日志记录语句;
其中,根据所述日志决策模型的输出结果判断是否需要在所述目标代码块中插入日志记录语句,包括:
获取所述日志决策模型的输出分数;
若所述输出分数大于预设分数阈值,则确定需要在所述目标代码块中插入日志记录语句;
若所述输出分数小于预设分数阈值,则确定不需要在所述目标代码块中插入日志记录语句。
2.根据权利要求1所述的方法,其特征在于,从所述目标代码块中提取目标代码块特征,包括:
将所述目标代码块输入至源码分析工具中,根据所述源码分析工具的输出结果确定目标代码块特征。
3.根据权利要求1所述的方法,其特征在于,在获取目标代码块之前,还包括:
获取训练项目中的样本代码块;
根据所述样本代码块中是否包含日志记录语句对所述样本代码块进行样本标记;
提取样本标记后的样本代码块的样本代码块特征;
基于所述样本代码块特征对预设机器学习模型进行训练,生成日志决策模型。
4.根据权利要求3所述的方法,其特征在于,在基于所述样本代码块特征对预设机器学习模型进行训练之前,还包括:
对所述样本代码块特征中的文本特征依次进行驼峰转换,小写转换,删除停止词,词干提取和词根化处理以及频率-逆文档频率TF-IDF转换;
基于文本挖掘分类器对经过TF-IDF转换后的文本特征进行降维处理,生成数值文本特征。
5.根据权利要求4所述的方法,其特征在于,基于文本挖掘分类器对经过TF-IDF转换后的文本特征进行降维处理,生成数值文本特征,包括:
基于分层随机抽样将经过TF-IDF转换后的文本特征均分为第一样本和第二样本;
基于所述第一样本训练出第一文本挖掘分类器,并基于所述第二样本训练出第二文本挖掘分类器;
基于所述第一文本挖掘分类器为所述第一样本分配第一置信度分数,并基于所述第二文本挖掘分类器为所述第二样本分配第二置信度分数;
将所述第一置信度分数和所述第二置信度分数作为数值文本特征。
6.根据权利要求3所述的方法,其特征在于,在根据所述样本代码块中是否包含日志记录语句对所述样本代码块进行样本标记之后,还包括:
当所述样本代码块中包含日志记录语句时,确定所述样本代码块中包含的日志记录语句的日志等级;
基于所述日志等级对所述样本代码块进行日志等级标记。
7.根据权利要求6所述的方法,其特征在于,所述日志等级包括致命等级、错误等级、警告等级、信息等级、调试等级和跟踪等级。
8.根据权利要求3所述的方法,其特征在于,所述预设机器学习模型包括随机森林算法、朴素贝叶斯算法、自适应增强Adaboost算法、支持向量机算法。
9.根据权利要求1-8任一所述的方法,其特征在于,代码块特征包括文本特征和句法特征;
其中,所述文本特征包括代码块的结构特征、代码块调用的方法名称、代码块中声明的变量名称、代码块的类型以及触发策略类型;所述代码块的结构特征包括代码块的源代码行SLOC、代码块调用的方法数目、代码块中声明的变量数目以及代码块中包含日志;
所述句法特征包括代码块中是否存在throw语句、是否存在assert语句、是否存在返回值以及是否存在中断异常类型中的任一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星环信息科技(上海)股份有限公司,未经星环信息科技(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010280035.0/1.html,转载请声明来源钻瓜专利网。





