[发明专利]一种科技项目申报线上服务终端在审

专利信息
申请号: 202010015896.6 申请日: 2020-01-08
公开(公告)号: CN110807449A 公开(公告)日: 2020-02-18
发明(设计)人: 江峰;李缙航 申请(专利权)人: 杭州皓智天诚信息科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06T5/00;G06T5/20;G06T7/13;G06T7/155
代理公司: 杭州创智卓英知识产权代理事务所(普通合伙) 33324 代理人: 郑思思
地址: 310000 浙江省杭州市余杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 科技 项目 申报 线上 服务 终端
【权利要求书】:

1.一种科技项目申报线上服务终端,包括资料收集单元、资料预检查单元和信息查询单元,其特征在于:所述资料收集单元用于对申报的科技项目数据资料进行收集和归类,所述资料预检查单元用于对申报的科技项目数据资料进行预处理检查,所述信息查询单元用于对申报的科技项目数据资料处理流程溯源信息进行查询。

2.根据权利要求1所述的科技项目申报线上服务终端,其特征在于:所述资料收集单元包括如下流程步骤:

S1.1、录入数据:录入科技项目数据;

S1.2、提取名称:提取录入的科技项目名称数据;

S1.3、提取关键字:提取科技项目名称数据中的关键词;

S1.4、数据分类:根据提取关键字的相似度对录入科技项目数据进行分类。

3.根据权利要求2所述的科技项目申报线上服务终端,其特征在于:所述S1.2中,提取名称选用边缘文字检测算法,其算法流程如下:

S1.2.1、使用边缘检测算子检测出名称文字边缘特征;

S1.2.2、对边缘特征进行滤波处理;

S1.2.3、通过形态学操作将边缘合并呈区域;

S1.2.4、根据水平投影算法提取文字区域。

4.根据权利要求3所述的科技项目申报线上服务终端,其特征在于:所述边缘检测算子采用Sobel算子检测文字边缘特征,其算子公式为:

(1)

(2)

K代表邻域点标记矩阵模板,以(i,j)为中心3×3 邻域矩阵,a为是条件中的控制因子,取值范围为0至1,通过多个的a取值来控制边缘的宽度;

矩阵(1)、(2)和(3)分别为该算子的X向卷积模板、Y向卷积模板以及待处理点的邻域点标记矩阵。

5.根据权利要求3所述的科技项目申报线上服务终端,其特征在于:所述边缘特征进行滤波处理采用高斯滤波处理,其公式如下:

其中,高斯滤波器宽度,决定着平滑程度,x为坐标,控制高斯核形状。

6.根据权利要求3所述的科技项目申报线上服务终端,其特征在于:所述水平投影算法的公式如下:

其中,E表示文本区域的边缘图,是图像中像素点的坐标,h为图像的高度,为横坐标为的水平投影。

7.根据权利要求2所述的科技项目申报线上服务终端,其特征在于:所述S1.3中,提取关键字采用TFIDF算法,其算法流程如下:

S1.3.1、先给本聚类内的所有文档进行分词,然后用一个字典保存每个词出现的次数;

S1.3.2、遍历每个词,得到每个词在所有文档里的IDF值以及在本聚类内出现的次数TF相乘的值;

S1.3.3、用一个字典来保存所有的词信息,然后按value对字典排序,最后取权重排名靠前的几个词作为关键词。

8.根据权利要求2所述的科技项目申报线上服务终端,其特征在于:所述关键字的相似度采用汉明距离的文本相似度计算方法,其计算方法公式如下:

其中,表示模2加运算, 表示两码字在相同位置上不同码符号的数目的总和,n为两个长码字之间的距离,k为码字个数。

9.根据权利要求2所述的科技项目申报线上服务终端,其特征在于:所述数据分类采用K-means聚类算法,其方法步骤如下:

S1.4.1、对于等待聚类的文本集D,确定要生成的簇的数目k;

S1.4.2、生成k个聚类中心作为聚类的初始中心点,;

S1.4.3、对D中的每一个文本,依次计算它与各个中心点的相似度;

S1.4.4、选取具有最大的相似度的中心点,将归入以为聚类中心的簇,从而得到D一个聚类;

S1.4.5、重新确定每个簇的中心点;

S1.4.6、反复执行S1.4.3-S1.4.5,到中心点不再改变,文本不再重新被分配为止。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州皓智天诚信息科技有限公司,未经杭州皓智天诚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010015896.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top