[发明专利]一种基于数据采集与关键字挖掘的自动日志生成系统及方法无效

专利信息
申请号: 201310132246.X 申请日: 2013-04-16
公开(公告)号: CN103309794A 公开(公告)日: 2013-09-18
发明(设计)人: 陈希;任远;张雨阳;侯祥泰 申请(专利权)人: 北京航空航天大学
主分类号: G06F11/34 分类号: G06F11/34
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 成金玉;贾玉忠
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 采集 关键字 挖掘 自动 日志 生成 系统 方法
【说明书】:

技术领域

发明涉及一种基于数据采集与关键字挖掘的自动日志生成系统及方法,属于计算机技术领域。

背景技术

个人计算机一词源自于1981年IBM的第一部桌上型计算机型号PC,在此之前有Apple II的能独立运行、完成特定功能的个人计算机。个人计算机不需要共享其他计算机的处理、磁盘和打印机等资源也可以独立工作。今天,个人计算机一词则泛指所有的个人计算机、如桌上型计算机、笔记型计算机、或是兼容于IBM系统的个人计算机等。基于个人计算机的功能面向使用计算机进行工作、学习、娱乐、沟通的用户的应用软件种类十分繁多,功能也十分强大。

长时间使用个人计算机工作学习的人都会面临时间分配的问题,集娱乐与学习工作功能于一体的计算机能帮助提高效率,同时也有可能导致对时间分配不合理,花费过多的时间在娱乐上导致工作学习的时间被压缩,特别是对于大学生,这个问题更加严重。因此需要一个对时间进行管理的个人计算机应用软件。

当前计算机所提供的工作日志一般有Linux系统下的工作日志,该日志记录了计算机所有的操作详情。但是使用起来过于复杂,并且数据也太过庞大,所以这并不适合普通用户。Windows系统在运行的过程中也会留下许多痕迹,记录计算机工作情况,并且以最直观和的图表等形式展现给用户是希望做到的。如何对数据的分析和提炼、如何展示才能有更好的用户体验,这是值得去研究的部分。

数据挖掘,又译为资料探勘、数据采矿。它是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。通过对个人计算机中的信息进行采集,并运用数据挖掘领域中的算法将有用的信息提取出来并加以分析,产生的分析结果对用户的使用会有很大帮助。

现有技术之中,结合键盘鼠标活动状态的数据加以推断分析进程类型的技术少有开发,由于判断精度是技术的难点之一,对计算机工作领域的了解的局限性也是实验设计局限的原因。

发明内容

本发明的技术解决问题是:克服现有技术的不足,提供一种基于数据采集与关键字挖掘的自动日志生成系统,具有良好的用户体验,直观地展现系统数据,并且定时向用户推送工作日志和优化建议,能够为用户提供良好的工作管理协助,提高用户工作效率,适宜处于工作环境下的科研以及学习的人群。

本发明技术解决方案:一种基于数据采集与关键字挖掘的自动日志生成系统,其特征在于包括:数据采集部分、数据分析部分、数据展示部分;所述数据采集部分包括键盘监听模块、剪贴板监听模块、鼠标监听模块、进程监听模块和数据存储模块;所述数据分析部分包括进程数据分析模块、鼠标键盘分析模块;数据展示部分包括数据即时展示模块和定时工作日志推送模块;

键盘监听模块,实现监听用户使用键盘的信息;用户按下的每个键位都会监听并记录下来,监听得到的信息将会以字符串的形式记录下来,此信息将会送往数据存储模块;

剪贴板监听模块,实现监听用户使用Windows操作系统剪贴板的情况;当剪贴板中的数据(主要是文字数据)发生变化时,将会对变化后的数据记录下来,数据将会送往数据存储模块;

鼠标监听模块,实现对鼠标的使用信息监听并记录;记录鼠标的点击频率,每间隔一段时间将会对鼠标的点击次数进行一次统计,以文字的形式记录下来,记录的数据将会送往数据存储模块;

进程监听模块,实现对Windows操作系统进程的使用情况进行记录,包括进程号、进程名、占内存大小,起始时间、占CPU百分比;过一段时间(如5s)进行刷新,将记录数据送至数据存储模块;

数据存储模块,实现数据存储功能,以数据库的形式展示;存储收集到的系统数据,对这些数据进行一些基础的管理以及保存的工作,数据存储模块中的数据将会在需要的时候被送到数据分析部分以及数据展示部分中的各模块;

进程数据分析模块,对采集并存储到数据存储模块的进程信息进行数据挖掘分析;将采集到的进程名与本自动日志生成系统预存在进程分析模块中的进程白名单相比对,得到第一级状态分类判断结果,然后状态分类则进入更细化高级的分类判断之中:包括所占内存与标准活动内存相比较,线程数与标准线程数相比较,优先级判断活动类型,启动次数则在数据挖掘环节作为阶段活动统计信息呈现出来;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310132246.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top