[发明专利]联系对象标识获取方法和装置有效
申请号: | 201510268164.7 | 申请日: | 2015-05-22 |
公开(公告)号: | CN104915664B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 王文渊;李斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联系 对象 标识 获取 方法 装置 | ||
本发明涉及一种联系对象标识获取方法和装置,所述方法包括:获取网页中的联系对象标识图片;从所述联系对象标识图片中分割出字符图片;提取分割出的字符图片的字符特征;根据预设样本字符特征库或者预设样本字符图片库,将所述字符特征识别为相应的字符;按照所述字符图片对应到所述联系对象标识图片中的位置,将相应的识别出的字符进行组合,获得联系对象标识。本发明提供的联系对象标识获取方法和装置,在通过网络爬虫爬取到联系对象标识图片后,可以采用模式识别的手段,从网页中提取出联系对象标识,为获取包括电话号码在内的联系对象标识提供了新的途径。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种联系对象标识获取方法和装置。
背景技术
目前,手机上可以运行通话应用,用户通过通话应用可以与其他用户进行通话,并生成通话记录。当手机接收到陌生电话号码来电,或者通话记录中存在陌生电话号码时,手机可以通过网络从电话号码库中获取该陌生电话号码的相关信息,从而将相关信息显示出来,以便用户可以识别出相应的联系对象。为了实现这一功能,需要建立尽量完备的电话号码库。
目前为了获取用于建立电话号码库的电话号码,可以通过人工录入的方式获取,但这种方式效率太低。目前效率较高的获取电话号码的方式是通过网络爬虫自动爬取网页中的电话号码,然而,这种方式仅能够从网页中获取到文本形式的号码,而事实上目前很多网页中的电话号码是图片形式的,通过网络爬虫是获取不到的。
发明内容
基于此,有必要针对目前通过网络爬虫无法获取到图片形式的电话号码的技术问题,提供一种联系对象标识获取方法和装置。
一种联系对象标识获取方法,所述方法包括:
获取网页中的联系对象标识图片;
从所述联系对象标识图片中分割出字符图片;
提取分割出的字符图片的字符特征;
根据预设样本字符特征库或者预设样本字符图片库,将所述字符特征识别为相应的字符;
按照所述字符图片对应到所述联系对象标识图片中的位置,将相应的识别出的字符进行组合,获得联系对象标识。
一种联系对象标识获取装置,所述装置包括:
联系对象标识图片获取模块,用于获取网页中的联系对象标识图片;
联系对象标识图片分割模块,用于从所述联系对象标识图片中分割出字符图片;
特征提取模块,用于提取分割出的字符图片的字符特征;
识别模块,用于根据预设样本字符特征库或者预设样本字符图片库,将所述字符特征识别为相应的字符;
字符组合模块,用于按照所述字符图片对应到所述联系对象标识图片中的位置,将相应的识别出的字符进行组合,获得联系对象标识。
上述联系对象标识获取方法和装置,从网页中获取联系对象标识图片后,分割成独立的字符图片,再从每个字符图片中提取出字符特征,根据该提取的字符特征进行识别,从而识别出相应的字符。然后按照分割出的字符图片对应到联系对象标识图片中的位置将识别出的字符进行组合,就可以得到完整的联系对象标识。这样在通过网络爬虫爬取到联系对象标识图片后,可以采用模式识别的手段,从网页中提取出联系对象标识,为获取包括电话号码在内的联系对象标识提供了新的途径。
附图说明
图1为一个实施例中电子设备的组成结构示意图;
图2为一个实施例中联系对象标识获取方法的流程示意图;
图3为一个实施例中联系对象标识图片的示意图;
图4为一个实施例中分割出的各个字符图片的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510268164.7/2.html,转载请声明来源钻瓜专利网。