[发明专利]云服务事件及服务等级合约数据的向量化方法有效
申请号: | 202110372833.0 | 申请日: | 2021-04-07 |
公开(公告)号: | CN112948132B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 李肖坚;张翠萍;杨昊澎;黄程灵 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/54;G06F9/48 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 冀学军 |
地址: | 541504 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务 事件 等级 合约 数据 量化 方法 | ||
1.一种云服务事件及服务等级合约数据的向量化方法,其特征在于包括有下列步骤:
步骤一,形式化云服务事件;
步骤101,云服务器日志收集;
收集云服务器执行作业的日志记录,日志记录中的作业记为JOB,JOB中存在有多个任务;将其中一个任务下的任意一个实例记录作为一次云服务事件;
步骤102,设置云服务事件的字段内容;
将所述进行云服务事件字段内容标记,记为
所述
所述中的下角标i表示任务的标识号,下角标j表示实例的标识号;
start_time表示实例的开始时刻;
end_time表示实例的结束时刻;
machine_id表示云服务器标识;
task_name表示任务名;
job_name表示作业名;
inst_name表示实例名;
seq_no表示实例重试的次数;
total_seq_no表示实例重试的总次数;
status表示实例的状态;
cpu_avg表示实例的平均CPU利用量;
cpu_max表示实例的最大CPU利用量;
mem_avg表示实例的平均内存利用量;
mem_max表示实例的最大内存利用量;
步骤二,构造云服务事件的状态元;
步骤201,云服务事件的主谓句式表达;
云服务事件中的每一个字段是句子的组成元素;应用句子结构成分方法,用双竖线划分出句子的主语部分和谓语部分;一次云服务事件用主谓句式的表述式记为SYS_EVENT,且SYS_EVENT=[时段],(特定)实例||[重试]呈态载荷;
步骤202,基于状态元表征的云服务事件的状况;
采用主谓句式SYS_EVENT=[时段],(特定)实例||[重试]呈态载荷对实例集各个实例的字段语义进行句子结构成分划分,构造出云服务事件的状态元集合,记为EVENT_STATUS,所述EVENT_STATUS包含的内容有:
云服务事件的时长状态元TIME用于描述云服务事件的时长状态,所述TIME={start_time,end_time};
云服务事件的位置状态元LOCATION用于描述云服务事件的位置状态,所述LOCATION={machine_id,job_name,task_name};
云服务事件的数量状态元NUMBER用于描述云服务事件的数量状态,所述NUMBER={inst_name};
云服务事件的重试状态元RETRY用于描述云服务事件的重试状态,所述RETRY={seq_no,total_seq_no};
云服务事件的操作状态元OPERATION用于描述云服务事件的操作状态,所述OPERATION={status};
云服务事件的CPU载荷状态元CPU用于CPU载荷元CPU描述云服务事件的CPU载荷状态,所述CPU={cpu_avg,cpu_max};
云服务事件的内存载荷状态元MEM用于内存载荷元MEM描述云服务事件的内存载荷状态,所述MEM={mem_avg,mem_max};
对于任意一个云服务事件字段内容构造得到的云服务事件状态元集合为:
步骤三,形式化云服务事件的服务等级合约;
基于大数据计算服务MaxCompute服务等级合约,并结合云服务事件字段内容构建得到云服务事件-状况规约SLAS;
所述
实例级的时长元规约
实例级的位置元规约
作业级的数量元规约
实例级的重试元规约
实例级的操作规约
实例级的CPU载荷规约
实例级的内存载荷规约
v表示谓词判定的条件;
谓词IsLongTail(·)表示实例的运行时段大于或等于长尾指标;
longtail_metric表示实例长尾的指标;
谓词IsUsued(·)表示实例的状态为Usued;
forbidden_machine表示被禁用的云服务器的标识;
谓词IsOverRedNumber(·)表示作业的Reduce实例数超过其数量指标;
rInstNumberOfJob表示一个作业中的Reduce实例数;
rNumber_metric表示一个作业中Reduce实例数指标;
谓词IsOverMapNumber(·)表示作业的Map实例数超过其数量指标;
mInstNumberOfJob表示一个作业中的Map实例数;
mNumber_metric表示一个作业中Map实例数指标;
谓词IsOverRetry(·)表示实例的重试次数或重试总次数超过重试违规指标;
retry_metric表示重试违规指标;
谓词IsFailed(·)表示实例的状态为Failed;
谓词IsReduceTask(·)表示变元是Reduce任务;
谓词IsMapTask(·)表示变元是Map任务;
谓词IsInterrupted(·)表示实例状态为Interrupted;
谓词IsOverPlanCPU(·)表示实例的CPU载荷超过计划的CPU载荷限额;
谓词IsOverPlanMEM(·)表示实例的内存载荷超过计划的内存载荷限额;
步骤四,提取违规元;
在符合步骤三制定的规约中的元素,则作为违规元;
违规元是指云服务事件-状况规约中涉及违反规定的元素;从所述SLAS中提取出的违规元构建得到云服务事件违规元集合
违反实例级的时长元规约sla4inst_time,称为时长元-违规元vf_longTail:
所述vf_longTail=end_time,start_time;
违反实例级的位置元规约sla4inst_location,称为位置元-违规元vf_location:
所述vf_location={machine_id,job_name,task_name};
违反作业级的数量元规约sla4job_number,称为数量元-违规元vf_number:
所述vf_number={inst_name};
违反实例级的重试元规约sla4inst_retry,称为重试元-违规元vf_retry:
所述vf_retry={seq_no,total_seq_no};
违反实例级的操作元规约sla4inst_operation,称为操作元-违规元vf_operation:
所述vf_operation={status};
违反实例级的CPU载荷元规约sla4inst_cpu,称为CPU载荷元-违规元vf_cpu:
所述vf_cpu={cpu_avg,cpu_max};
违反实例级的内存载荷元规约sla4inst_mem,称为内存载荷元-违规元vf_mem:
所述vf_mem={mem_avg,mem_max};
违规是指未达到云服务事件-状况规约的行为;事件违规是指云服务事件违反规约则所述违规;
违规元是指涉及违反规约中的因素;违规元揭示云服务事件违规的本质,从而能够为准确地判定违规生成出所需的向量样本,故需要发现所述云服务事件违规的因素(即违规元),它成为云服务事件的违规元;为从多个方面考虑云服务事件可能涉嫌违规的因素,因此,构造出云服务事件状态元集合
步骤五,提取指标;
从云服务事件-状况规约以及云服务事件违规元集合提取出违规限制值作为违规指标,得到规约-指标集合METRIC;
所述
location_metric表示位置违规的指标;
number_metric表示作业级的数量违规指标;
operation_metric表示实例级的操作违规指标;
cpu_metric表示实例级的CPU载荷违规指标;
mem_metric表示实例级的内存载荷违规指标;
步骤六,映射构建状况元-违规元-联系组;
依据云服务事件状态元集合及其云服务事件违规元集合映射出状态元-违规元联系元组,从而得到状况元-违规元-联系元组集,记为PSV;
所述
PSV_TIME表示“时长状态元-时长违规元”联系元组;
PSV_LOCATION表示“位置状态元-位置违规元”联系元组;
PSV_NUMBER表示“数量状态元-数量违规元”联系元组;
PSV_RETRY表示“重试状态元-重试违规元”联系元组;
PSV_OPERATION表示“操作状态元-操作违规元”联系元组;
PSV_CPU表示“CPU载荷状态元-CPU载荷违规元”联系元组;
PSV_MEM表示“内存载荷状态元-内存载荷违规元”联系元组;
依据事件的时长状态元TIME及其违规元vf_longTail,映射出时长状态元-时长违规元联系元组PSV_TIME:
PSV_TIME=(end_time,start_time);
依据事件的位置状态元LOCATION及其违规元vf_location,映射出位置状态元-位置违规元联系元组PSV_LOCATION:
PSV_LOCATION=(machine_id,job_name,task_name);
依据数量状态元NUMBER及其违规元vf_number,映射出数量状态元-数量违规元联系元组PSV_NUMBER:
PSV_NUMBER=(inst_name);
依据事件的重试状态元RETRY及其违规元vf_retry,映射出重试状态元-重试违规元联系元组PSV_RETRY:
PSV_RETRY=(seq_no,total_seq_no);
依据事件的操作状态元OPERATION及其违规元vf_operation,映射出操作状态元-操作违规元联系元组PSV_OPERATION:
PSV_OPERATION=(status);
依据事件的CPU载荷状态元CPU及其违规元vf_cpu,映射出“CPU载荷状态元-CPU载荷违规元”联系元组PSV_CPU:
PSV_CPU=(cpu_avg,cpu_max);
依据事件的内存载荷状态元MEM及其违规元vf_mem,映射出“内存载荷状态元-内存载荷违规元”联系元组PSV_MEM:
PSV_MEM=(mem_avg,mem_max);
步骤七,构造状况元-指标元-联系组;
步骤701,依据映射出的状况元-违规元-联系元组集以及提取出的规约-指标集合构造云服务事件的状态元-指标元-元组集合,记为PSM;
所述
PSM_TIME表示时长状态元-时长违规元指标元组;
PSM_LOCATION表示位置状态元-位置违规元指标元组;
PSM_NUMBER表示数量状态元-数量违规元指标元组;
PSM_RETRY表示重试状态元-重试违规元指标元组;
PSM_OPERATION表示操作状态元-操作违规元指标元组;
PSM_CPU表示CPU载荷状态元-CPU载荷违规元指标元组;
PSM_MEM表示内存载荷状态元-内存载荷违规元指标元组;
时长状态元-时长违规元指标元组
位置状态元-位置违规元指标元组
数量状态元-数量违规元指标元组
重试状态元-重试违规元指标元组
操作状态元-操作违规元指标元组
CPU载荷状态元-CPU载荷违规元指标元组
内存载荷状态元-内存载荷违规元指标元组
步骤702,依据状态元-指标元-元组集合将状况事件与指标做笛卡尔积,构造出云服务事件的状况-指标联系元组,记为RSM;
所述RSM=(EVENT_STATUS,METRIC)
EVENT_STATUS表示实例状况事件;
METRIC表示事件的违规指标;
构造的云服务事件状况-指标联系元组
n表示实例的总数目;
plan_cpu表示实例级的CPU载荷违规指标;
plan_mem表示实例级的内存载荷违规指标;
步骤八,生成云服务事件的状况-指标向量化样本;
向量化方法是类比自然语言的word2vec方法,将云服务事件与其服务等级合约数据量化为向量;
读入实例集遍历每个实例状况事件的状态元
若任意一实例的状态元不为空,则抽取出位置状态元值和数量状态元值中的数值;
Terminated态映射为数值0;
Ready态映射为数值1;
Running态映射为数值2;
Terminating态映射为数值3;
Interrupted态映射为数值4;
Failed态映射为数值5;
若时长状态元、重试状态元、CPU载荷状态元以及内存载荷状态元的值为数值,则保存其数值;若CPU载荷状态元、内存载荷状态元的值存在空值,则将其填为数值0;
若任意一实例的状态元为空,则说明已遍历且量化完所述的所有状态元最后保存状态元的量化结果至文件中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110372833.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业外部数据采集与分析系统
- 下一篇:一种目标检测方法及目标检测系统