[发明专利]基于字符串核的手绘草图识别方法有效
申请号: | 201110151853.1 | 申请日: | 2011-06-08 |
公开(公告)号: | CN102184395A | 公开(公告)日: | 2011-09-14 |
发明(设计)人: | 廖士中;段孟华 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 字符串 手绘 草图 识别 方法 | ||
技术领域
本发明涉及基于核方法的手绘草图识别。
背景技术
本发明所涉及的背景技术包括以下三个方面:
一、手绘草图识别
手绘草图识别是将笔式交互获取的模糊的草图表达映射至精确的图形表达,即从人机交互过程中不断增长的草图信息中挖掘草图形状约束,在领会用户本来意图的基础上,把自由的、不规则的草图识别成为规则的、精确的几何形状。
目前主要存在三种方式的图形识别方法,即基于笔划表示的方法;基于直线、弧、曲线等图元表示的方法;基于几何特征的图形识别方法。
1、基于比划的表示方法
通常情况下,草图识别系统通过笔式交互方式获取的草图表现为若干由用户在落笔与提笔间的取样点序列构成的笔划。笔划是图形重要的构成信息。早期的系统视笔划为符号,赋予它特定的含义,将笔划的识别等同于图形的识别。单笔划识别中,较为经典的是:Rubine方法,该方法简单有效,但它要求用户必须以固定模式的笔划来勾勒图形,而且图形构成比较简单。
2、基于图元的表示方法
基于图元表示将图形表示为直线、弧、曲线等图元在一定空间关系下的组 合。基于图元的方法通常包含分割、拟合、规整、识别等步骤。用户绘制的草图可以自动拆分成图元及其关系,图形模板的训练不需要用户干预,模板库容易扩展,适应性强。但不可避免地训练模板以及对图形测试所有己定义的属性增加了系统开销。
3、基于几何特征的识别
基于几何特征的方法直接将图形当成识别单元,直接提取草图的几何特征用于分类。通常它要以一定的方式先分割好不同的图形几何特征的抽取实质上是将笔划信息降维,但由于图形的复杂性,很难以固定维数的几何特征保留笔划的完整信息,部分信息在降维过程中丢失了。因此,几何特征的方法识别的精确性不高一些视觉不相似的图形的几何特征表示可能相近。
二、字符串核(Sting Kernel)
核方法表示一组相关的机器学习和数据挖掘算法。核方法的关键组成部分是核函数,核函数可以度量输入数据的相似性。基于这些核函数,可以通过支持向量机(SVM)完成分类、回归等任务。
字符串核可处理输入数据类型为字符串的数据,通过字符串核函数度量两个输入字符串的相似性。
字符串核可分为多种,例如:谱-类似的,计算两个输入字符串的公共子串的字符串核,基于比对的字符串核,由概率模型获得的字符串核。
字符串核已应用于蛋白质同源检测、文本分类等领域。
三、支持向量机(Support Vector Machine,SVM)
支持向量机(Support Vector Machine,SVM)是著名的基于核方法的系统。
支持向量机(support vector machine,SVM)借助于最优化方法解决机器学习问题的新工具。它由Vapnik及其合作者发明,在1992年计算机学习理论的会议上介绍进入机器学习领域,之后受到了广泛的关注。近年来在其理论研究和 算法实现方面都取得了突破性进展,并成为克服“维数灾难”和“过学习”等传统困难的有力手段。SVM的理论体系涵盖的对象极为广泛,如对偶表示、特征空间、学习理论、优化理论和算法等。SVM在文本分类、手写识别、图像分类、生物信息学等领域中获得了比较好的应用。
该算法在集合L变为空,或者λ足够小的时候停止。
发明内容
基于上述现有技术,本发明提出了一种基于字符串核的手绘草图识别方法,结合手绘草图识别、字符串核、支持向量机这三项已有技术,实现一种能够持续训练/积累的新的手绘草图识别方法。
本发明提出了一种基于字符串核的手绘草图识别方法,该方法包括以下步骤:
步骤一,将手绘草图映射为特征字符串,对输入的手绘草图进行等距离采样,采样距离阈值根据经验选择5像素,并且限定采样的时间阈值内(0.7秒)连续采样一个草图;将采样的手绘草图映射成特征字符串,还包括以下步骤:
取一正整数n;计算采样到的手绘草图的外接矩形,并将草图的外接矩形均分为n2份;每一个分割后获得的小矩形都可以使用二维坐标x,y来表示,其中1≤x,y≤n并且x,y∈N;当且仅当一个小矩形的中心点落在了手绘草图围成的区域内时,我们认为该小矩形被填充了;将一个手绘草图映射成了一个长度为n2的特征字符串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110151853.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网络支付方法及系统
- 下一篇:用于电解铝厂整流柜直流电输出的直流母线结构