[发明专利]基于问答网站知识的软件配置故障自动修复方法和系统有效
申请号: | 201610202074.2 | 申请日: | 2016-04-01 |
公开(公告)号: | CN105824718B | 公开(公告)日: | 2018-10-19 |
发明(设计)人: | 李影;贾统;岳阳;吴中海 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/30;G06F17/30 |
代理公司: | 北京万象新悦知识产权代理事务所(普通合伙) 11360 | 代理人: | 张肖琪 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于问答网站知识的软件配置故障自动检测与修复的方法和系统,包括在线阶段和离线阶段;离线阶段对问答网站数据进行爬取,得到问题网站中的问题和答案;记录问题和答案的对应关系,建立问题日志库;将提取得到的修复方法和指令存入修复指令仓库;在线阶段收集用户系统数据,包括用户系统运行日志和用户系统文件目录;通过计算用户系统运行日志和问题日志的相似度定位用户系统故障,通过搜索修复指令仓库得到相应修复指令,生成相应的故障修复脚本。本发明可实现对基于开源软件构建的云计算系统进行软件配置故障诊断与修复,提高云计算系统的可靠性和可用性。 | ||
搜索关键词: | 基于 问答 网站 知识 软件 配置 故障 自动 修复 方法 系统 | ||
【主权项】:
1.一种基于问答网站知识的软件配置故障自动修复方法,包括在线阶段和离线阶段;离线阶段对问答网站数据进行爬取,提取得到问题网站中的问题和答案;问题包括问题日志数据,答案包括修复方法和指令;记录问题和答案的对应关系,建立问题日志库;将提取得到的修复方法和指令存入修复指令仓库;具体执行如下步骤:21)对问答网站数据进行爬取,提取得到问答网站中的问题和答案,具体是:首先通过过滤问答网站数据得到与故障配置相关的可用问题页面,再从所述可用问题页面中提取得到故障包含的问题日志数据和对应的答案数据;21a)每一个问题包括一条或多条问题日志信息,针对步骤21)得到的问题日志数据进行过滤清洗,提取问题日志特征生成问题日志特征向量,获得问题与问题日志特征向量的对应关系,将问题、问题日志特征向量和对应关系存储,生成问题日志库;21b)针对步骤21)得到的答案数据,通过文本分析提取答案数据中的指令和文件操作,具体是:对答案数据进行切分,对切分成的每一部分进行归类并标注相应标签,所述标签类型分别是:描述,文件路径,命令,配置,日志和代码;所述切分是使用解决方案和文件路径作为分隔符,将答案数据划分为多个部分,每个部分被标注为上述标签类型中的一种类型;由此将所述答案数据转换为标签的有序组合;21b1)针对步骤21b)转换后得到的答案内容,设置三种修复模式:第一种修复模式为{文件路径,配置};第二种修复模式为{文件路径,配置,配置};第三种修复模式为{命令,配置};21b2)利用修复模式匹配算法将问题修复方法从答案数据中提取出来,每个答案数据提取得到一个或多个问题修复方法;针对提取得到的问题修复方法设置操作类型;针对提取出的每个问题修复方法确定相应的操作类型;由此,将每个答案数据转换成为由设置操作类型的一个或多个问题修复方法组成的一个修复指令;将修复指令存入修复指令仓库,供修复用户系统配置故障使用;在线阶段收集用户系统数据,用户系统数据包括用户系统运行日志和用户系统文件目录;通过计算用户系统运行日志和问题日志的相似度,定位用户系统故障,通过搜索修复指令仓库得到相应修复指令,生成相应的故障修复脚本;根据故障修复脚本实现修复用户系统故障;具体执行如下步骤:11)当有用户系统日志输入时,获取用户系统文件目录信息和用户系统运行日志,分别转换为目录特定格式和系统日志特定格式;12)对用户系统运行日志进行预处理,提取得到用户系统日志的特征向量;13)当系统出现故障或者用户提交故障片段日志时,通过查询所述问题日志库索引获取问答网站日志数据和问题日志文本特征向量,通过计算得到用户日志与问答网站问题日志之间的相似度,通过相似度匹配的方法定位用户系统的配置故障,获得用户故障定位信息;14)根据用户故障定位信息,从所述修复指令仓库中提取得到修复该故障的修复指令,所述修复指令中的动态部分是从用户的系统文件目录信息提取得到的文件路径;15)根据步骤14)得到的修复指令包含的待修复配置文件,查找得到用户系统中相应的配置文件,生成修复脚本,所述修复脚本是能够对用户系统中的配置文件进行修改的可执行脚本;16)运行修复脚本,修复软件配置故障。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610202074.2/,转载请声明来源钻瓜专利网。
- 上一篇:计算机云端备份还原系统
- 下一篇:一种管理程序内存占用量的方法和终端