[发明专利]基于校园WiFi大数据的学生时空模型与数据清洗方法在审
| 申请号: | 202010460172.2 | 申请日: | 2020-05-27 |
| 公开(公告)号: | CN111611235A | 公开(公告)日: | 2020-09-01 |
| 发明(设计)人: | 毕警予;周东波;张炘;余雅滢;王小梅;喻宏伟 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06F16/28;G06F16/29;G16Y10/55;G16Y20/40;G16Y40/10 |
| 代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 张雪 |
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 校园 wifi 数据 学生 时空 模型 清洗 方法 | ||
1.一种基于校园WiFi大数据的学生行为时空模型与数据清洗方法,其特征在于,包括如下步骤:
S1、获取校园中WiFi路由器的源日志文件,以日期和WiFi路由器编号为序建立编目管理;
S2、根据WiFi路由器的源日志文件的记录格式,提取认证字段中用户的身份信息;根据学生的注册信息,提取与学生相关的记录;
S3、解析与学生相关的记录中的时间信息、位置的空间信息,根据WiFi路由器的位置、WiFi路由器事务发生的时间以及教务系统的相关信息判断学生当前时刻的行为,构建针对于学生的当前行为的时空属性,建立学生在某一时刻的时空向量表达,并建立以学生为中心的临时存储文件;
S4、完成对所有日志文件的解析,以学生对象为单位,汇集其临时存储文件的行为时空向量,以时间为序,对所有行为时空向量采用由远及近的排序,采用张量表达,形成基于张量的学生日常行为的时空模型;
S5、使用面向对象的非结构化序列方法,对每一个学生基于张量的日常行为时空模型进行非结构化的组织与存储,最终存储到相应的非结构化数据库中,建立行为时空数据库,完成对日志文件的清洗。
2.根据权利要求1所述的校园WiFi大数据的学生行为时空模型与数据清洗方法,所述步骤S3包括如下内容,
S31、对WiFi路由器的日志文件进行解析,提取包括学生信息的日志记录;
S32、解析某一条记录项,获取记录的时间、WiFi路由器位置,以及WiFi路由器的事件信息;
S33、根据WiFi路由器的位置,查找校园管理部门路由器位置设定表,得到相应的地点信息,结合教务管理系统中的排课信息确定当前时刻学生的行为;
S34、根据时间特征与位置特征,标记教学时间之外的行为;
S35、按照学生、时间、位置、行为构建学生在某一时刻的时空向量表达,并构建以学生为中心的临时存储文件。
3.根据权利要求1所述的基于校园WiFi大数据的学生时空模型与数据清洗方法,其中,所述步骤S4包括如下内容,
S41、遍历所有日志文件,并解析得到相应的学生信息,存储到相应的临时文件;
S42、对每一个学生行为的临时文件,取出学生的行为时空向量,以对向量进行时序排序;
S43、建立学生行为时空张量表达,依时序排序的行为时空向量为张量元素,最终形成表达整个时间跨度的学生日常行为的张量模型;在构建张量模型时,首先将一天的时间分成若干时间段,然后从记录学生行为的临时文件中获取每个时间段学生所处地理位置和此时间段学生行为的数据,进而构建学生日常行为的张量模型。
4.根据权利要求1所述的基于校园WiFi大数据的学生时空模型与数据清洗方法,所述步骤S5包括如下内容,
S51、对每一个表达学生时常行为的时空张量模型,构建面向对象的序列化方法;
S52、完成对每一个学生的时空张量模型的非结构化组织结构并针对所采用的数据库,构建其序列化与反序列化算法;在序列化张量模型时,首先根据张量结构存储的不同种类的数据的含义,用计算机语言中类的概念定义张量结构,同时在类声明文件中对类及其属性声明添加可序列化的注解信息,将普通类标记为可序列化类,在可序列化类为需要序列化的属性添加可序列化注解,将属性标记为可序列化属性;对可序列化类,加载类信息及类中所有可序列化属性信息到内存,形成预加载序列化信息;根据预加载序列化信息,获取待处理字节序列中所有可序列化属性,并根据序列化顺序排序;获取待处理字节序列的内容;根据所述内存中加载的所述序列化信息和属性类型信息将所述字节序列中的内容转换为属性值;
S53、采用非关系数据NoSQL进行存储,完成对数据的清洗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010460172.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





