[发明专利]一种基于大数据技术的专利数据采集系统在审
申请号: | 202010217200.8 | 申请日: | 2020-03-25 |
公开(公告)号: | CN111428110A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 彭飞荣;杨磊;张蕾;胡智敏 | 申请(专利权)人: | 浙江知多多网络科技有限公司;中国计量大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F21/60;G06F21/31;G06Q50/18 |
代理公司: | 北京恒泰铭睿知识产权代理有限公司 11642 | 代理人: | 周成金 |
地址: | 310016 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 技术 专利 采集 系统 | ||
本发明涉及专利数据采集技术领域,且公开了一种基于大数据技术的专利数据采集系统,包括:在专利采集管理服务器的专利采集管理系统上制定专利大数据采集任务,专利采集管理服务器调用专利采集云服务器集群中的专利采集云节点服务器Si,专利采集云节点服务器Si采用网络爬虫根据专利大数据采集任务去抓取Hidden Web网页服务器内的相对应的专利大数据,网络爬虫将所抓取的专利大数据返回到专利采集云节点服务器Si内;专利采集云服务器集群中的专利采集云节点服务器Si的调用管理系统采用零知识证明的验证方法对专利采集管理服务器的身份进行验证。本发明解决了未经授权的服务器非法调用专利采集云服务器集群中的节点服务器的问题。
技术领域
本发明涉及专利数据采集技术领域,具体为一种基于大数据技术的专利数据采集系统。
背景技术
专利信息资源是首选的竞争情报资源,它蕴含着巨大的知识存量。充分挖掘和利用专利信息有助于技术人员改进现有技术,发现新的技术领域。然而当前专利数量急剧增长,依靠人工手段寻找有用专利信息,并进行快速有效的专利分析,犹如大海捞针般费时费力。
考虑到专利信息深藏于Web专利库中,一般采用部署有网络爬虫的服务器集群从存储有专利大数据并支持访问和下载的Hidden Web网页服务器中抓取专利大数据,而在实际运行过程中服务器集群中的节点服务器存在被非法调用的风险。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供一种基于大数据技术的专利数据采集系统,以解决未经授权的服务器非法调用专利采集云服务器集群中的节点服务器的问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:
一种基于大数据技术的专利数据采集系统,包括:运行有专利采集管理系统软件的专利采集管理服务器,运行有调用管理系统且部署有网络爬虫的专利采集云服务器集群,以及存储有专利大数据并支持访问和下载的Hidden Web网页服务器;
所述的专利采集云服务器集群由专利采集云节点服务器S1、专利采集云节点服务器S2、专利采集云节点服务器S3,…,专利采集云节点服务器Sn组成;
在专利采集管理服务器的专利采集管理系统上制定专利大数据采集任务,专利采集管理服务器调用专利采集云服务器集群中的专利采集云节点服务器Si,专利采集云节点服务器Si采用网络爬虫根据专利大数据采集任务去抓取Hidden Web网页服务器内的相对应的专利大数据,网络爬虫将所抓取的专利大数据返回到专利采集云节点服务器Si内;
专利采集云服务器集群中的专利采集云节点服务器Si的调用管理系统采用零知识证明的验证方法对专利采集管理服务器的身份进行验证,其交互验证方法,包括以下步骤:
步骤一:专利采集管理服务器在专利采集云节点服务器Si的调用管理系统上进行用户注册,具体包括:
(1)调用管理系统在注册页面上弹出与专利采集管理服务器进行交互式通信的对话框;
(2)专利采集管理服务器随机选择两个大素数pi和qi,计算ni=pi×qi和专利采集管理服务器随机选择素数ei,使计算出使(di,ni)=1;将ni和ei传送给调用管理系统,即输入到对话框内;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江知多多网络科技有限公司;中国计量大学,未经浙江知多多网络科技有限公司;中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010217200.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置