[发明专利]满文部件集的构建方法有效

专利信息
申请号: 201810371805.5 申请日: 2018-04-24
公开(公告)号: CN108564089B 公开(公告)日: 2020-10-23
发明(设计)人: 郑蕊蕊;李敏;贺建军;许爽;吴宝春 申请(专利权)人: 大连民族大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/68
代理公司: 大连智高专利事务所(特殊普通合伙) 21235 代理人: 刘斌
地址: 116600 辽宁省*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 满文 部件 构建 方法
【权利要求书】:

1.一种满文部件集的构建方法,其特征在于:

构建一个满文部件初始集,并置每个满文部件的Flag=0,使用满文部件切分方法对满文单词图像进行分割,并统计和分析分割结果:若分割后的部件不属于初始集,则将该部件加入初始集,并置该部件的Flag=1;若分割后的部件属于满文部件初始集,则置对应部件的Flag=1,检查初始集中是否有部件的Flag=0,判断是否有部件在分割结果中从未出现过,若存在该部件则将该部件从初始集中删除,整理并输出满文部件集;

所述满文部件切分方法:

S1.满文部件粗切分:以满文单词图像中轴线为中心将满文单词图像分为左侧部、中部、右侧部,左侧部的范围为满文单词图像的第1列到第bl-1列,右侧部的范围为满文单词图像的第br+1列到第W列,分别对左侧部和右侧部水平投影,记为plpr;设阈值T1,只有满足条件Cost(i)≤T1的行是候选切分行,T1 =⌈1/2 × baseline_width⌉,baseline_width是满文单词图像中轴线的宽度;第i行的切分代价函数Cost(i) = pl(i)+ pr(i) , i = 1,2,…,H,bl是中轴线的左边界,br是中轴线的右边界,W是满文单词图像的宽度,H是满文单词图像的高度;

S2.弱分割区域的判定与细切分;

S3.过分割区域判定与合并;

其中:S3.过分割区域判定与合并的步骤是:

设定过分割判定阈值T_over,计算Seg1序列中每个切分区域的高度ho,则以下式判定过分割区域:

hoT_over×baseline_width

符合上式高度的切分区域被判定为过分割区域;

采用以下规则合并过分割区域:

(1) 若第1个切分区域过分割,则与第2个切分区域合并;否则转步骤(2);

(2) 若倒数第2个切分区域过分割,则与最后一个切分区域合并;否则转步骤(3);

(3) 若过分割区域既不是第1个,也不是倒数第2个,则分别计算其相邻的上、下2个切分区域的高度h_uph_lw,如果h_uph_lw,则与上一个切分区域合并;如果h_uph_lw,则合并到下一个切分区域;否则转步骤(4);

(4) 若过分割区域的上、下2个相邻区域的高度相等,则分别计算与上区域合并后的连通域个数num_up,与下区域合并后的连通域个数num_lw,如果num_upnum_lw,则与上一个切分区域合并,如果num_upnum_lw,则与下一个切分区域合并;

(5) 输出合并过分割区域的切分行序列。

2.如权利要求1所述的满文部件集的构建方法,其特征在于,设过分割判定阈值T_over=1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810371805.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top