[发明专利]基于字符切分和颜色聚类的数字视频中的字符提取方法无效
申请号: | 200910081927.1 | 申请日: | 2009-04-08 |
公开(公告)号: | CN101515325A | 公开(公告)日: | 2009-08-26 |
发明(设计)人: | 黄晓冬;马华东;张赫 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 北京德琦知识产权代理有限公司 | 代理人: | 夏宪富 |
地址: | 100876*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于字符切分和颜色聚类的数字视频中的字符提取方法,其步骤是:(1)字符切分:利用字符区域与字符间隔区域的特征差异,进行垂直投影来切分字符区域图像,将每行含多个字符的区域图像,切分成只含单个字符的多个子区域图像,降低后续操作处理难度,提高OCR的识别准确率;(2)字符提取:先用图像中的字符颜色特征进行颜色聚类,找到含最多字符信息的图层作为目标图层,删除背景区域;再用字符的连通特征分析目标图层的连通区域,去除非字符区域后,分别得到单个字符图像、字符区域的整体图像和由单个字符图像拼接的整体图像的三种结果,都输入给OCR系统进行识别;后两者是用OCR的语义处理功能,能根据上下文准确确定形近字而提高识别效果。 | ||
搜索关键词: | 基于 字符 切分 颜色 数字视频 中的 提取 方法 | ||
【主权项】:
1、一种基于字符切分和颜色聚类的数字视频中的字符提取方法,其特征在于,包括下列操作步骤:(1)字符切分:采用基于垂直投影特征的分析切分方法,即利用字符区域与字符间隔区域的特征差异,进行垂直投影来切分字符区域图像,将每一行包含多个字符的区域图像,切分成只包含单个字符的若干个子区域图像,以降低后续步骤的处理复杂度,提高准确率,保证OCR的较高的识别率;(2)字符提取:先用图像中的字符颜色特征进行颜色聚类,找到包含最多字符信息的图层作为目标图像,从而快速删除大部分背景区域信息;再用字符的连通特征分析目标图像的连通区域,继续去除剩余的非字符区域后,分别得到三种类型的字符图像:单个字符提取图像、字符区域的整体提取图像和由单个字符提取图像拼接成的整体拼接图像,一起输入给OCR系统进行识别;其中后两种图像是用OCR的语义处理功能,根据上下文更准确地确定形近字而提高识别效果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910081927.1/,转载请声明来源钻瓜专利网。