[发明专利]文字云的内容语句和词语的解析方法及装置在审
| 申请号: | 201811481265.2 | 申请日: | 2018-12-05 |
| 公开(公告)号: | CN109710920A | 公开(公告)日: | 2019-05-03 |
| 发明(设计)人: | 蒋渊;高若愚;潘蕊;李邦源;董凌 | 申请(专利权)人: | 云南电网有限责任公司玉溪供电局 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/00 |
| 代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 张清彦 |
| 地址: | 653100 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种文字云的内容语句和词语的解析方法及装置,方法包括:获取文字云的图像;进行OCR识别提取后,按照颜色、字体、大小、间距和一定规律的旋转角度对文字云的内容进行文字归类;按照标点符号、空格和语句特征库为分界进一步归类成语句,再进行剔重,对语句中的各词语进行分析,当包含的词语有对应行业信息时,以各词语的行业在各词语的行业总数中占比最多的行业为唯一定义,优先关联匹配该词语在该行业的含义;输出文字云的内容、图像内容分析的语句及语句中词语的优先关联配对的含义内容或其他相关含义内容。本发明能将文字云的内容输出可以快速理解的方式、能提高对文字云的内容语句及行业术语含义识别与关联呈现的效率。 | ||
| 搜索关键词: | 语句 词语 含义内容 归类 解析 图像内容分析 空格 标点符号 关联 关联匹配 输出文字 行业术语 行业信息 分界 特征库 配对 字体 图像 输出 分析 | ||
【主权项】:
1.一种文字云的内容语句和词语的解析方法,其特征在于,包括如下步骤:A)获取文字云的图像,并将其加载到运算方法中进行图像OCR识别;B)对图像形状中的文字进行OCR识别提取后,按照颜色、字体、大小、间距和一定规律的旋转角度对所述文字云的内容进行文字归类;C)对归类后的文字按照标点符号、空格和语句特征库为分界进一步归类成语句,再进行剔重,最后结合词语特征库对所述语句中的各词语进行分析,当包含的词语有对应行业信息时,以各词语的行业在各词语的行业总数中占比最多的行业为唯一定义,优先关联匹配该词语在该行业的含义;D)输出所述文字云的内容、图像内容分析的语句及语句中词语的优先关联配对的含义内容或其他相关含义内容;E)对所述语句特征库和词语特征库中的内容进行查询、补充、修改或输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司玉溪供电局,未经云南电网有限责任公司玉溪供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811481265.2/,转载请声明来源钻瓜专利网。





