[发明专利]关键词抽取方法、装置、电子设备及计算机可读存储介质在审
| 申请号: | 202010011174.3 | 申请日: | 2020-01-06 |
| 公开(公告)号: | CN113076441A | 公开(公告)日: | 2021-07-06 |
| 发明(设计)人: | 汪华东;刘松;孟祥峰 | 申请(专利权)人: | 北京三星通信技术研究有限公司;三星电子株式会社 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/20 |
| 代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
| 地址: | 100028 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关键词 抽取 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种关键词抽取的方法,其特征在于,包括:
提取待处理图像对应的特征信息;
基于所述特征信息,从所述待处理图像中抽取关键词。
2.根据权利要求1所述的方法,其特征在于,所述特征信息包括文本表达信息和图像视觉信息中的至少一项;文本表达信息包括文本内容和文本视觉信息中的至少一项。
3.根据权利要求2所述的方法,其特征在于,所述文本视觉信息,包括待处理图像中各个文本行对应的文本视觉信息;
对于一个文本行,该文本行对应的文本视觉信息包括以下至少一项:
该文本行对应的文本特征图;
该文本行在所述待处理图像中的位置信息;
该文本行中的各个词在所述待处理图像中的位置信息;
该文本行中的各个词在该文本行中的相对位置信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述特征信息,从所述待处理图像中抽取关键词,包括:
将所述特征信息进行编码,得到所述特征信息的编码结果;
基于所述编码结果,从所述待处理图像中抽取关键词。
5.根据权利要求4所述的方法,其特征在于,所述特征信息包括文本表达信息和图像视觉信息,其中,文本表达信息包括文本视觉信息和文本内容中的至少一项;
所述编码结果包括文本背景表示、图像特征表示、文本行结构信息以及主题信息表示中的至少一项;
其中,所述文本背景表示是基于文本表达信息得到的,所述图像特征表示是基于图像视觉信息得到的,所述文本行结构信息以及主题信息表示是基于文本背景表示得到的。
6.根据权利要求4或5所述的方法,其特征在于,所述基于所述编码结果从所述待处理图像中抽取关键词,包括:
基于所述编码结果,确定各预测时间步各自所对应的目标预测模式、以及所述目标预测模式对应的预测词;
输出各预测时间步所对应的预测词;
基于所述各预测时间步所对应的预测词,得到关键词。
7.根据权利要求6所述的方法,其特征在于,针对一个预测时间步,基于所述编码结果,确定预测时间步所对应的目标预测模式、以及所述目标预测模式对应的预测词,包括以下至少一项:
基于所述编码结果,确定该预测时间步对应于预配置的各预测模式的预测词以及该预测时间步所对应的目标预测模式,并基于所述各预测模式的预测词以及该预测时间步所对应的目标预测模式,得到所述目标预存模式对应的预测词;
基于所述编码结果,从预配置的各预测模式中确定该预测时间步所对应的目标预测模式,基于所述编码结果,得到所述目标预测模式对应的预测词。
8.根据权利要求6或7所述的方法,其特征在于,预配置的预测模式包括:
基于词库进行关键词预测的第一预测模式;
基于文本行所包含的各词进行关键词预测的第二预测模式。
9.根据权利要求8所述的方法,其特征在于,若所述目标预测模式为所述第二预测模式,基于所述编码结果,确定所述目标预测模式对应的预测词,包括:
基于所述编码结果,确定所述待处理图像中的文本内容所包含的各词分别对应的权重;
基于所述各词分别的权重,确定所述目标预测模式对应的预测词。
10.根据权利要求9所述的方法,其特征在于,所述图像特征信息包括文本表达信息和图像视觉信息,其中,文本表达信息包括文本视觉信息和文本内容中的至少一项,所述编码结果包括文本背景表示和图像特征表示,所述文本背景表示是基于文本表达信息得到的,所述图像特征表示是基于图像视觉信息得到的;
基于所述编码结果,确定所述待处理图像中的文本内容所包含的各词分别对应的权重,包括:
基于所述编码结果通过特征融合处理,得到当前预测时间步对应的隐向量;
基于文本背景表示以及所述隐向量,确定所述待处理图像中的文本内容所包含的各词分别对应的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010011174.3/1.html,转载请声明来源钻瓜专利网。





