[发明专利]一种图像的文本信息的生成、显示方法及电子设备有效
申请号: | 201610675750.8 | 申请日: | 2016-08-16 |
公开(公告)号: | CN107766853B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 赵小伟;孙佰贵;华先胜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;周达 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 信息 生成 显示 方法 电子设备 | ||
1.一种图像的文本信息的生成方法,其特征在于,包括:
获取目标图像的表征数据;其中所述表征数据表征所述目标图像的内容特征;
根据所述表征数据和当前限制词汇共同进行词汇预测,得到当前预测词汇;
当所述当前预测词汇与预设词汇相匹配时,将针对所述目标图像进行词汇预测得到的结果集中的词汇作为所述目标图像的文本信息;其中,所述结果集中包括至少一个词汇。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述当前预测词汇与预设词汇不相匹配时,将所述当前预测词汇记入所述结果集中;并将所述当前预测词汇作为下一次词汇预测的限制词汇。
3.根据权利要求1所述的方法,其特征在于,根据所述表征数据以及当前限制词汇进行词汇预测,得到当前预测词汇具体包括:
按照预设词汇映射关系,将所述表征数据和当前限制词汇的集合映射为当前预测词汇。
4.根据权利要求3所述的方法,其特征在于,所述预设词汇映射关系通过下述步骤建立:
获取样本训练集,所述样本训练集中包括至少一个样本图文关联组,所述样本图文关联组中包括相关联的样本图像表征数据与样本描述词汇集,所述样本描述词汇集中的描述词汇按照预设规则排列;
针对所述样本训练集中的每组样本图文关联组,所述预设词汇映射关系均满足:
对于样本描述词汇集中任意相邻的第一描述词汇和第二描述词汇,其中,所述第一描述词汇位于所述第二描述词汇之前,所述预设词汇映射关系将所述样本图像的表征数据和所述第一描述词汇的集合映射为所述第二描述词。
5.根据权利要求4所述的方法,其特征在于,所述样本描述词汇集通过以下步骤确定:
获取每个样本图像对应的描述语句;
按照每个所述描述语句中词汇的词性,将每个所述描述语句拆分为预设数量的词汇;其中,所述预设数量的词汇形成与所述样本图像对应的词汇组;
从每个所述样本图像对应的词汇组中筛选出至少一个特征词汇,并按照所述预设规则对所述至少一个特征词汇进行排序,形成每个所述样本图像对应的样本描述词汇集。
6.根据权利要求5所述的方法,其特征在于,从所述预设数量的词汇中筛选出至少一个特征词汇具体包括:
确定所述预设数量的词汇中各个词汇对应的优先级参数;
将优先级参数大于或者等于预设参数阈值的词汇确定为所述特征词汇。
7.根据权利要求5所述的方法,其特征在于,当所述样本图像对应的描述语句有多个时,将重复次数最多的描述语句确定为所述样本图像对应的描述语句。
8.根据权利要求5所述的方法,其特征在于,按照所述预设规则对所述至少一个特征词汇进行排序具体包括:
确定所述至少一个特征词汇中各个词汇分别对应的属性名;
按照预先确定的属性名排序规则,对所述至少一个特征词汇进行排序。
9.根据权利要求3所述的方法,其特征在于,按照预设词汇映射关系,将所述表征数据和当前限制词汇的集合映射为当前预测词汇具体包括:
根据所述预设词汇映射关系,确定所述表征数据和当前限制词汇的集合对应的词汇概率组,所述词汇概率组中包括至少一个概率值,其中,每个概率值均与一个词汇相对应;
将所述词汇概率组中最大的概率值对应的词汇确定为所述当前预测词汇。
10.根据权利要求1所述的方法,其特征在于,将针对所述目标图像进行词汇预测得到的结果集中的词汇作为所述目标图像的文本信息具体包括:
将针对所述目标图像进行词汇预测得到的结果集中的词汇按照预设排列规则的排列组合作为所述目标图像的文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610675750.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:化学反应箱(003)
- 下一篇:化学反应桶(001)
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置