[发明专利]一种语义信息融合方法、装置、电子设备及存储介质在审
申请号: | 202011573556.1 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112597278A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 任亮;傅雨梅;文齐辉;车倩 | 申请(专利权)人: | 北京知因智慧科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/211;G06F40/284;G06F40/30 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 余菲 |
地址: | 100000 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 信息 融合 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供一种语义信息融合方法、装置、电子设备及存储介质,涉及语义信息融合技术领域。该方法包括利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量;通过语料库获得每个类别单词对应的视觉特征描述;根据所述视觉特征描述获取融合视觉特征的句嵌入向量;将所述第二词嵌入向量和所述句嵌入向量按照预设的比例系数进行融合,以生成融合视觉特征后的词嵌入向量,在原有类别单词的词嵌入向量基础上,补充其他类别的视觉特征信息,从而缓解语义间隔造成的影响,解决现有方法中导致语义间隔的问题。
技术领域
本申请涉及语义信息融合技术领域,具体而言,涉及一种语义信息融合方法、装置、电子设备及存储介质。
背景技术
目前在零样本图像分类任务中常使用词嵌入向量和属性向量这两种语义向量来表征类别,但普遍具有单词可能会产生歧义性和词嵌入向量与类别的视觉特征没有必然联系两个问题,从而导致语义间隔问题。
发明内容
本申请实施例的目的在于提供一种语义信息融合方法、装置、电子设备及存储介质,在原有类别单词的词嵌入向量基础上,补充其他类别的视觉特征信息,从而缓解语义间隔造成的影响,解决现有方法中导致语义间隔的问题。
本申请实施例提供了一种语义信息融合方法,所述方法包括:
利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量;
通过语料库获得每个类别单词对应的视觉特征描述;
根据所述视觉特征描述获取融合视觉特征的句嵌入向量;
将所述第二词嵌入向量和所述句嵌入向量按照预设的比例系数进行融合,以生成融合视觉特征后的词嵌入向量。
在上述实现过程中,通过SIF算法融入视觉特征信息生成的词嵌入向量不仅具有较强的语义性,且在语义空间中与相近的类别也会更加相似,有效缓解语义间隔带来的影响。
进一步地,所述利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量,包括:
通过Word2Vec模型或GloVe模型获取每个类别单词的第一词嵌入向量;
根据所述第一词嵌入向量利用词袋模型获取句子的第二词嵌入向量;
所述第二词嵌入向量表示为:
其中,vs表示所述句子的第二词嵌入向量,n表示所述句子中的单词总数,vi表示所述句子的第i个单词的第一词嵌入向量。
在上述实现过程中,词袋模型不需要考虑文法以及单词的顺序,将一句话或一段文本中的所有单词的第一词嵌入向量取平均值用来作为整个类别的类别语义向量,因此计算简单高效,且减少高频词汇的贡献,增加低频词汇的贡献,从而反映句子主题。
进一步地,所述通过语料库获得每个类别单词对应的视觉特征描述,包括:
通过爬虫的方式采集网络数据库中的视觉特征信息,以生成语料库;
获取所述语料库中的每个类别单词对应的视觉特征描述。
在上述实现过程中,通过爬虫可采集到每个类别单词对应的视觉特征描述。
进一步地,所述根据所述视觉特征描述获取融合视觉特征的句嵌入向量,包括:
对所述视觉特征描述进行学习,以获取所述视觉特征描述的第三词嵌入向量;
利用Sent2Vec模型并结合n-gram的词和所述第三词嵌入向量,以获得所述句嵌入向量;
所述句嵌入向量表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京知因智慧科技有限公司,未经北京知因智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011573556.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置