[发明专利]图片生成方法、装置、计算机设备和介质在审
申请号: | 202010225699.7 | 申请日: | 2020-03-26 |
公开(公告)号: | CN113450433A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 崔苗苗;谢宣松 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06N3/04 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 李镇江 |
地址: | 英属开曼群岛大*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 生成 方法 装置 计算机 设备 介质 | ||
1.一种图片生成方法,包括:
生成第一码序列,所述第一码序列包含至少基于物品图生成的物品图层和至少基于文案生成的文案图层的图层信息;
将第一码序列输入到串联的卷积层和长短期记忆LSTM层,输出第二码序列,所述第二码序列代表生成的图片图层信息;
基于第二码序列,生成所述图片。
2.根据权利要求1所述的方法,其中,所述物品图层除了基于所述物品图之外,还基于图片生成要求生成;所述文案图层除了基于所述文案之外,还基于图片生成要求生成。
3.根据权利要求2所述的方法,其中,所述第一码序列包含代表所述物品图层的码串、和代表所述文案图层的码串,其中每个码串包括颜色代码、卷积神经网络CNN特征代码、主题风格代码、设计手法代码、元素种类代码、空间信息代码,分别用于表示该码串代表的图层的颜色特征、CNN特征、主题风格特征、设计手法特征、元素种类特征、空间信息特征。
4.根据权利要求3所述的方法,其中,所述颜色代码通过以下方式获得:
对该码串代表的图层的各像素的颜色进行聚类;
将所述颜色聚成的类的标识作为所述颜色代码。
5.根据权利要求4所述的方法,其中,所述对该码串代表的图层的各像素的颜色进行聚类包括:
将该码串代表的图层的各像素的颜色组成颜色向量;
确定该颜色向量与作为聚类中心的多个聚类基准颜色向量的距离;
将距离最小的聚类基准颜色向量作为聚类结果。
6.根据权利要求3所述的方法,其中,所述CNN特征代码通过以下方式获得:
将该码串代表的图层输入CNN,由所述CNN输出所述CNN特征代码。
7.根据权利要求3所述的方法,其中,所述主题风格代码通过以下方式获得:
如所述图片生成要求中指示主题风格,将指示的主题风格转换成所述主题风格代码;
如所述图片生成要求中未指示主题风格,将该码串代表的图层的各像素的颜色输入主题风格机器学习模型,由所述主题风格机器学习模型输出主题风格代码。
8.根据权利要求3所述的方法,其中,所述设计手法代码通过以下方式获得:
如所述图片生成要求中指示设计手法,将指示的设计手法转换成所述设计手法代码;
如所述图片生成要求中未指示设计手法,将该码串代表的图层的各像素的颜色输入设计手法机器学习模型,由所述设计手法机器学习模型输出设计手法代码。
9.根据权利要求3所述的方法,其中,所述元素种类代码通过以下方式获得:
从该码串代表的图层中识别元素;
将识别出的元素的种类转换成元素种类代码。
10.根据权利要求3所述的方法,其中,所述空间信息代码通过以下方式获得:
将该码串代表的图层的覆盖区域的长度和宽度分别进行m等分和n等分,将所述覆盖区域划分成m×n个矩形格,其中,m和n为自然数;
根据图层中的图层元素所占的矩形格的标识,生成所述空间信息代码。
11.根据权利要求1所述的方法,其中,在生成第一码序列后,所述方法还包括:
展示所述第一码序列对应的物品图层和文案图层;
接收用户对展示的物品图层和文案图层的第一调整指示;
响应于所述第一调整指示,对所述第一码序列进行调整。
12.根据权利要求1所述的方法,其中,所述将第一码序列输入到串联的卷积层和长短期记忆LSTM层,包括:
将所述第一码序列输入所述卷积层前加入的嵌入层,由嵌入层输出升高维度后的码序列;
将升高维度后的码序列输入串联的卷积层和长短期记忆LSTM层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010225699.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:夹持装置
- 下一篇:一种机器人手臂及机器人