[发明专利]基于图文语义的网络社交表情包合成方法、电子设备和计算机可读存储介质有效
| 申请号: | 202110320523.4 | 申请日: | 2021-03-25 |
| 公开(公告)号: | CN113177994B | 公开(公告)日: | 2022-09-06 |
| 发明(设计)人: | 谢诚;李小瑞;汪玉金;袁乾峰;李宾 | 申请(专利权)人: | 云南大学 |
| 主分类号: | G06T11/60 | 分类号: | G06T11/60;G06F40/30;G06V10/80;G06V10/82;G06N3/08 |
| 代理公司: | 昆明金科智诚知识产权代理事务所(普通合伙) 53216 | 代理人: | 杨钊霞 |
| 地址: | 650091 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图文 语义 网络 社交 表情 合成 方法 电子设备 计算机 可读 存储 介质 | ||
1.基于图文语义的网络社交表情包合成方法,其特征在于,包括以下步骤:
步骤1,收集社交用户常用的网络社交表情包图片,将各表情包图片分为j个部分,对其进行语义标注,每条语义标注对应包括j个特征;
步骤2,使用中文词向量模型将各表情包图片的语义标注转化为文本描述向量,将语义标注中的j个特征分别转换为词特征向量;
步骤3,对各词特征向量进行条件增强得到条件增强向量,将条件增强向量与噪声向量合成j个特征对应的增广向量;
步骤4,利用各增广向量训练DetailGANj网络,生成表情包图片中各部分对应的内容块;训练DetailGANj网络时,将j个特征对应的增广向量分别作为生成器Gj的输入,生成表情包图片中各部分对应的内容块,将各内容块和真实表情包图片的各部分作为判别器Dj的输入,以判别器损失函数最大化、生成器损失函数最小化为目标训练得到DetailGANj网络;所述生成器损失函数与判别器损失函数如下:
其中分别为第j个判别器Dj的损失函数、第j个生成器Gj的损失函数,xDij、tij分别为第i幅表情包图片中第j个部分的图片及其特征,pdataij为第i幅表情包图片中第j部分的真实数据分布,表示xDij、tij均采样于pdataij,表示生成器Gj的训练图像Zj采样于噪声PZ、tij采样于pdataij,eij为第i幅表情包图片中第j个特征生成的词特征向量,fcaij为cij的增广向量,N(μ(eij),∑0(eij))是均值为μ(eij)、对角方差矩阵为∑0(eij)的标准高斯分布,N(0,xDij)是均值为0、对角方差矩阵为xDij的条件高斯分布,DKL为标准高斯分布N(μ(eij),∑0(eij))与条件高斯分布N(0,xDij)的KL散度,λ为平衡标准高斯分布N(μ(eij),∑0(eij))与条件高斯分布N(0,xDij)的正则化参数;
步骤5,对所述内容块进行下采样得到联合向量,对联合向量进行条件增强与增广得到增广向量;
步骤6,利用增广向量和文本描述向量训练JoinGAN网络,得到基于图文语义的表情包合成图片;训练JoinGAN网络时,将增广向量与文本描述向量作为生成器G的输入生成表情包图片将表情包图片和真实表情包图片x共同作为判别器D的输入,以判别器损失函数LD最大化、生成器损失函数LG最小化为目标训练JoinGAN网络;所述判别器损失函数LD、生成器损失函数LG如下:
其中LD、LG分别为判别器D的损失函数、生成器G的损失函数,xi、Ti分别为第i幅真实表情包图片及其语义标注,pdatai为第i幅表情包图片的真实数据分布,表示xi、Ti均采样于pdatai,表示联合向量采样于DetailGANj网络生成的表情包图片、Ti采样于pdatai,为第i幅表情包图片的文本描述向量,fca为c的增广向量,表示均值为对角方差矩阵为的标准高斯分布,N(0,xi)为均值为0、对角方差矩阵为xi的条件高斯分布,D′KL为与N(0,xi)的KL散度,λ′为平衡与N(0,xi)的正则化参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110320523.4/1.html,转载请声明来源钻瓜专利网。





