[发明专利]基于多模态的冷链配载用户画像标签抽取方法及装置有效
申请号: | 202111471016.7 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114218380B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 李翔;张宁;谢乾;朱全银;高尚兵;马甲林;王媛媛;丁行硕;束玮;张豪杰;丁婧娴;张曼;费晶茹;洪玉昆;杨秋实;徐伟 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06V10/762;G06K9/62;G06V10/764;G06V10/80;G06V10/774;G06V10/82;G06N3/04 |
代理公司: | 淮安市科文知识产权事务所 32223 | 代理人: | 吴晶晶 |
地址: | 223400 江苏省淮*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 配载 用户 画像 标签 抽取 方法 装置 | ||
1.一种基于多模态的冷链配载用户画像标签抽取方法,其特征在于,包括如下步骤:
步骤1:输入原始的冷链配载数据集D1,对数据集进行去重、去空,清洗后得到样本集D2;
步骤2:使用K-means对样本集D2进行聚类,得到N个聚类点簇,进而将聚类后的样本集D2打上标签;
步骤3:将带标签的文本样本集作为BERT模型的输入,得到特征向量T1,将得到的特征向量T1传入长短期记忆网络进一步提取特征,得到文本特征向量T2;
步骤4:获取双模态交互注意力矩阵Bim,具体步骤如下:
步骤4.1:将步骤2中经过预处理后的图片数据作为YOLO模型的输入;
步骤4.2:得到提取后的图片数据的特征R1;
步骤4.3:将得到的特征R1映射到其语义空间中,得到图片特征向量R2=tanh(WtR1+bR1),其中,Wt为激活函数tanh的权重,bR1为激活函数tanh的偏置;
步骤4.4:将文本特征向量T2和图片特征向量R2交互,使用激活函数tanh进行转换表示补充;
步骤4.5:T2经R2补充过后得到T3,计算公式为T3=tanh(UT2T2+WrtUT2T2),UT2为隐藏文本对应的转换矩阵,Wrt为相应两模态的映射的权重矩阵;
步骤4.6:R2经T2补充过后得到R3,计算公式为R3=tanh(UR2R2+WrtUR2R2),UR2为隐藏关系对应的转换矩阵;
步骤4.7:将文本特征向量T3和图片特征向量R3进行拼接,并通过一个全连接层捕捉模态间交互特征F1,即F1=ReLU(W1(T3⊕R3)+b1),W1为激活函数ReLU的权重,b1为激活函数ReLU的偏置;
步骤4.8:将交互特征F1在激活函数Sigmoid的作用下生成条件向量S,计算公式为S=Sigmoid(F1);
步骤4.9:将条件向量S与交互后的T3结合得到文本条件向量N1,计算公式为N1=T3⊙S;
步骤4.10:将条件向量S与交互后的R3结合得到图片条件向量N2,计算公式为N2=R3⊙S;
步骤4.11:将两种模态的条件向量N1和N2进行矩阵乘法计算,得到跨模态联合矩阵O,计算公式为O=N1·N2;
步骤4.12:如果循环变量k≤单模态特征维度u,跳转到下一步,否则跳转到步骤4.15;
步骤4.13:使用Softmax函数计算出跨模态联合矩阵的概率a,计算公式为
步骤4.14:k=k+1,跳转到步骤4.12;
步骤4.15:将双模态交互特征F1乘概率a,得到双模态交互注意力矩阵Bim,计算公式为Bim=a·F1;
步骤5:将双模态交互注意力矩阵Bim与被补充过的双模态特征向量拼接,将其作为全连接层的输入得到双模态特征表示,最后输入至Softmax进行分类,最终获得模型的标签抽取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111471016.7/1.html,转载请声明来源钻瓜专利网。