[发明专利]适用于企业用户研发数据库的维护方法在审
申请号: | 201710437604.6 | 申请日: | 2017-06-10 |
公开(公告)号: | CN107273481A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 孙娅;罗亚利 | 申请(专利权)人: | 苏州唯亚信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 苏州唯亚智冠知识产权代理有限公司32289 | 代理人: | 宋秀丽 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适用于 企业 用户 研发 数据库 维护 方法 | ||
技术领域
本发明涉及一种数据库维护方法,尤其涉及一种适用于企业用户研发数据库的维护方法。
背景技术
就现有的企业研发数据收集来看,往往是采用人工方式,通过关键词以及逻辑公式进行不同数据库的检索,以获得相关的资源信息。但是,这种搜集方式费时费力,搜集完毕后还需要通过人工进行二次比对,才能过滤出可用的参考信息。对于研发需求量大的部门或是企业,人力成本投入较大,且因为人员差异化会导致搜集差异。
同时,数据库建立后,往往得不到维护,在初期还不会出现数据重复与乱码。但是,长时间使用后就会出现数据陈旧与重复。
有鉴于上述的缺陷,本设计人,积极加以研究创新,以期创设一种适用于企业用户研发数据库的维护方法,使其更具有产业上的利用价值。
发明内容
为解决上述技术问题,本发明的目的是提供一种适用于企业用户研发数据库的维护方法。
本发明的适用于企业用户研发数据库的维护方法,其中:存储服务器划分有独立的存储区域,将存储服务器内的原始数据上传至云端服务器进行备份,对原始数据进行关键词、词频的采集,生成检索标签,将原始数据依据检索标签的不同,存入对应的存储区域内,通过检索标签,从对外接口进行定时数据抓取,抓取的数据通过解析服务器解析过滤后,重新存入存储服务器内与检索标签相匹配的存储区域中的,采用去重模块,对存储区域中的内容进行去重操作。
进一步地,上述的适用于企业用户研发数据库的维护方法,其中,所述存储服务器按照设定周期,将原始数据上传至云端服务器,所述的设定周期为间隔四天。
更进一步地,上述的适用于企业用户研发数据库的维护方法,其中,所述关键词、词频的采集为依据中文语序,进行断句、断词划分,获取词组,将重复率较高的词组进行词频标注,最终生成独立的检索标签,每个独立的检索标签,均对应相关的数据内容。
更进一步地,上述的适用于企业用户研发数据库的维护方法,其中,所述对外接口为服务器所处的内网接口与外网接口,所述内网接口与外网接口上均设置有放侵入模块。
更进一步地,上述的适用于企业用户研发数据库的维护方法,其中,所述解析过滤为,将外来抓取到的数据,根据检索协议,进行关键词匹配,将存有关键词的词句进行保留,匹配检索标签。
再进一步地,上述的适用于企业用户研发数据库的维护方法,其中,所述去重操作为,排查存储区域存在的非正确叠词、错别字、乱码。
借由上述方案,本发明至少具有以下优点:
1、设有独立的存储区域,满足分配存储,为后续检索提供快速引导。
2、设有检索标签,可让用户通过标签点选来快速获取研发数据。
3、能够周期性免人工补充数据库内容,保证数据库的自主抓取与更新。
4、可实现去重,提升检索便利。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例详细说明如后。
具体实施方式
下面结合实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
适用于企业用户研发数据库的维护方法,其与众不同之处在于:为了针对不同的数据进行独立存储,实现快速引导、检索与快速数据提取,采用的存储服务器划分有独立的存储区域。同时,将存储服务器内的原始数据上传至云端服务器进行备份。这样,保证底层数据的存储安全。为了便于用户实现便捷化的标签检索,无需重复录入关键词来找寻研发数据内容,实现研发类数据的快速比对,对原始数据进行关键词、词频的采集。之后,生成检索标签,将原始数据依据检索标签的不同,存入对应的存储区域内。为了对实现外部数据的及时补充,有效更新、扩充数据库,可通过检索标签,从对外接口进行定时数据抓取。并且,抓取的数据通过解析服务器解析过滤后,重新存入存储服务器内与检索标签相匹配的存储区域中的。再者,为了对数据进行有效整合,防止出现数据的重复录入或是乱码,本发明还采用去重模块,对存储区域中的内容进行去重操作。
结合本发明一较佳的实施方式来看,存储服务器按照设定周期,将原始数据上传至云端服务器,设定周期为间隔四天。这样,满足常见的服务器更新频率,不造成服务器运行负担。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州唯亚信息科技股份有限公司,未经苏州唯亚信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710437604.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:新闻模板的管理方法及装置
- 下一篇:基于HBase的告警数据存储方法及装置