[发明专利]用于图纸排版的文本断句方法及系统在审
申请号: | 201710187190.6 | 申请日: | 2017-03-27 |
公开(公告)号: | CN107038152A | 公开(公告)日: | 2017-08-11 |
发明(设计)人: | 席斌;李明;王兴强;彭成超 | 申请(专利权)人: | 成都优译信息技术股份有限公司 |
主分类号: | G06F17/25 | 分类号: | G06F17/25;G06F17/27;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙)51220 | 代理人: | 冯龙 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图纸 排版 文本 断句 方法 系统 | ||
1.用于图纸排版的文本断句方法,其特征在于,包括以下步骤:
S1:对完成断句的句群进行SVM学习;
S2:利用学习后的SVM对需要断句的句群进行分析;
S3:根据分析结果对需要断句的句群进行断句。
2.根据权利要求1所述的用于图纸排版的文本断句方法,其特征在于,步骤S1包括以下子步骤:
S11:收集完成断句的句群;
S12:标记完成断句的句群中需要提取特征的地方;
S13:对标记后句群的特征进行SVM学习。
3.根据权利要求2所述的用于图纸排版的文本断句方法,其特征在于,步骤S13中所述SVM学习包括利用线性核函数对特征进行处理。
4.根据权利要求3所述的用于图纸排版的文本断句方法,其特征在于,所述SVM学习后形成二元分类器。
5.根据权利要求1所述的用于图纸排版的文本断句方法,其特征在于,步骤S2包括以下子步骤:
S21:输入需要断句的句群;
S22:标记需要断句的句群中需要提取特征的地方;
S23:对标记后句群的特征通过SVM进行分析。
6.采用权利要求1方法的用于图纸排版的文本断句系统,其特征在于,包括:
对完成断句的句群进行SVM学习的学习单元;
利用学习后的SVM对需要断句的句群进行分析的分析单元;
根据分析结果对需要断句的句群进行断句的断句单元。
7.根据权利要求6所述的用于图纸排版的文本断句系统,其特征在于,所述分析单元包括:
用于输入需要断句的句群的输入模块;
用于标记需要断句的句群中需要提取特征的地方的标记模块;
用于对标记后句群的特征通过SVM进行分析的分析模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术股份有限公司,未经成都优译信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710187190.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种恒张力自动放卷储料机构
- 下一篇:波纹管成型机