[发明专利]一种网页信息标注及提取系统在审
申请号: | 202110871566.1 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113536186A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 李正军;涂著刚;杨敏;汤双明 | 申请(专利权)人: | 贵阳高新数通信息有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F40/117;G06F40/126;G06F40/279;G06K9/62 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 刘永来 |
地址: | 550000 贵州省贵阳市高新*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 信息 标注 提取 系统 | ||
本发明涉及网络信息提取技术领域,具体涉及一种网页信息标注及提取系统,包括用户端和后台管理端;用户端包括数据标注模块、数据训练模块和数据调用模块;其中,数据标注模块,用于根据用户的偏好、习惯及熟悉程度对待提取的网页信息进行标记,得到标记数据;数据训练模块,用于对标记数据进行训练,得到提取网页信息的调用模型;数据调用模块,用于通过调用模型对网页信息进行识别、提取,并输出识别结果。本发明提高了训练模型所需数据的质量、数量以及处理效率,也便于多人协同处理网页信息;同时训练所得的模型亦可快速对网页信息进行高准确率的识别、抽取并输出结果。
技术领域
本发明涉及网络信息提取技术领域,具体涉及一种网页信息标注及提取系统。
背景技术
目前,随着互联网技术的发展,可以运用大数据、云计算实现互联网互联互通以及信息共享,避免出现“信息孤岛”和“协同不足”的问题。比如说,随着电子招投标不断探索发展,电子招投标平台和其他系统也实现了互通互联,资源共享,提高了信息的流通性,增加了企业招投标活动的便利性。故而,电子招投标平台能让信息开放,吸引更多的投标人投标,使得招标人寻找意向投标人时有更多的选择。
虽然,招投标模式电子化与互联网大数据融合已成必然趋势,但是电子招投标的现状仍有不足的地方,电子招投标行业发展也伴随着各种困难。随着全国各地电子招投标的日益成熟,平台之间实现连接,业内可以建立一体化的信息共享体系。比如说,按照相关要求,为工程招标和企业采购搭建的第三方交易平台,充分实现招投标活动的电子化和互联网化,能够实现在线、异地电子化招标、投标和电子化评标等交易过程,并开放数据接口,可选、实时、有限地对有关招标、投标数据信息进行编辑、生成、对接、交换和发布。
对于不同的用户群体来说,他们对于招标、投标的了解程度、熟悉程度可能存在差异性,而目前的用于工程招标和企业采购的第三方交易平台,并未充分考虑用户的个体化差异,故而,不能为用户提供个性化服务,用户不能根据自己的实际需求,并结合自己的偏好、习惯及熟悉程度自主选择需要标记的数据类型;同时,也不能快速地对网页信息进行识别、抽取,也不便于多人协同处理网页信息。
发明内容
本发明提供一种网页信息标注及提取系统,解决了现有技术不能快速地对网页信息进行识别、抽取,也不便于多人协同处理网页信息的技术问题。
本发明提供的基础方案为:一种网页信息标注及提取系统,包括:
用户端和后台管理端;
后台管理端包括用户创建模块、项目创建模块、数据创建模块和兼职创建模块;其中,用户创建模块,用于创建用户;项目创建模块,用于创建项目和项目配置,项目储存项目基本信息的model,项目配置关联项目并储存项目详细信息的model;数据创建模块,用于导入数据集并关联项目,存储数据类型和标题,并关联标记数据;兼职创建模块,用于创建兼职信息和兼职结算,兼职信息储存用户兼职相关的信息并关联用户,兼职结算储存用户兼职时的收益信息并关联用户和兼职信息;
用户端包括数据标注模块、数据训练模块和数据调用模块;其中,数据标注模块,用于根据用户的偏好、习惯及熟悉程度对待提取的网页信息进行标记,得到标记数据;数据训练模块,用于对标记数据进行训练,得到提取网页信息的调用模型;数据调用模块,用于通过调用模型对网页信息进行识别、提取,并输出识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵阳高新数通信息有限公司,未经贵阳高新数通信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110871566.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种制造网络节点分类方法及系统
- 下一篇:一种多功能LED灯具
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置