[发明专利]一种基于面向对象语言处理的档案管理方法有效
申请号: | 202110684522.8 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113515610B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 周杏;李帅 | 申请(专利权)人: | 中盾创新数字科技(北京)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06Q10/06 |
代理公司: | 北京嘉途睿知识产权代理事务所(普通合伙) 11793 | 代理人: | 彭成 |
地址: | 102101 北京市延*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 面向 对象 语言 处理 档案 管理 方法 | ||
1.一种基于面向对象语言处理的档案管理方法,其特征在于,包括:
获取待处理档案,对待处理档案进行预处理;
对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据;
基于所述用户交互数据和所述元数据,选择语言查询平台,将所述待处理档案发送至所述语言查询平台;
所述对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据,还包括:
获取用户的阅读档案和档案修改数据,根据所述阅读档案和所述档案修改数据,生成用户的浏览及修改明细信息,根据所述浏览及修改明细信息,生成所述用户行为的样本数据;
对所述用户行为的样本数据进行分类聚合,以得到所述样本数据的特征集;
从所述特征集包含的特征字段中选取第一预定数量个特征字段,根据选取出的预定数量个特征字段,从所述特征集中获取第二预定数量的特征数据,基于获取到的所述特征数据,通过逻辑回归算法进行模型训练;
从所述用户行为的样本数据中获取在预定时间内进行了浏览但并未修改的样本数据,根据获取到的在所述预定时间内进行了浏览但并未修改的样本数据,获得特征字段的值,根据获得的特征字段的值,调用所述逻辑回归模型进行计算,得到分类后待处理样本。
2.如权利要求1所述的一种基于面向对象语言处理的档案管理方法,其特征在于,所述获取待处理档案,对待处理档案进行预处理,包括:
获取不同档案类型对应的待处理档案,分别对所述待处理档案进行逐条解析,获取预先选择的档案类型对应的待处理档案;
对所述预先选择的档案类型对应的待分析档案进行分析,根据预先配置的指标参数获取分析后的档案中的属性指标;
对所述属性指标进行统计,并输出统计结果;
所述指标参数包括档案管理人员关心的指标,根据系统默认的指标参数获取待处理档案中的档案基本指标和交互属性基本指标;
其中,档案基本指标包括档案媒体类型、档案数据体量、档案分布式需求;交互属性基本指标包括档案生成时延、http档案下载速率、ftp档案下载速率、下载时长和丢包率。
3.如权利要求1所述的一种基于面向对象语言处理的档案管理方法,其特征在于,所述基于所述用户交互数据和所述元数据,选择语言查询平台,将所述待处理档案发送至所述语言查询平台,还包括:
基于所述用户交互数据和所述元数据,确定所述待处理档案的处理优先级;
基于所述待处理档案的处理优先级,确定语言查询平台;
所述语言查询平台包括sql语言查询平台、hql语言查询平台、MongoDB语言查询平台;
所述sql语言查询平台采用结构化查询语言,以二维表形式存储和查询数据;
所述hql语言查询平台采用分布式结构,hive构建分布式查询语言;
所述MongoDB采用spring data框架中的PagingAndSortingRepository接口实现在分页查询。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中盾创新数字科技(北京)有限公司,未经中盾创新数字科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110684522.8/1.html,转载请声明来源钻瓜专利网。