[发明专利]图片生成方法、装置、计算机设备和介质在审
申请号: | 202010225699.7 | 申请日: | 2020-03-26 |
公开(公告)号: | CN113450433A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 崔苗苗;谢宣松 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06N3/04 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 李镇江 |
地址: | 英属开曼群岛大*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 生成 方法 装置 计算机 设备 介质 | ||
本公开提供了一种图片生成方法、装置、计算机设备和介质。该方法包括:生成第一码序列,所述第一码序列包含至少基于物品图生成的物品图层和至少基于文案生成的文案图层的图层信息;将第一码序列输入到串联的卷积层和长短期记忆LSTM层,输出第二码序列,所述第二码序列代表生成的图片图层信息;基于第二码序列,生成所述图片。本公开提高了图片生成的个性化程度,提高多样性,使设计更智能化。
技术领域
本发明涉及机器学习领域,更具体而言,涉及一种图片生成方法、装置、计算机设备和介质。
背景技术
目前,有一些为用户根据用户的图片素材制作成品图片的应用、网站等,例如根据用户的物品或人像照片为用户制作海报,或根据产品照片来制作平面广告图片,以取代设计师、美工等人为工作。这些应用、网站等一般采取预先设定的一些固定范式,如“背景+物品修饰+文案修饰+文案……”,或套取预先设计的模板。这样,必然导致图片缺乏创意,多样性差等问题。
发明内容
有鉴于此,本公开提出一种图片生成技术,它能够提高图片生成的个性化程度,提高多样性,使设计更智能化。
为了达到这个目的,根据本公开的一个方面,提供了一种图片生成方法,包括:
生成第一码序列,所述第一码序列包含至少基于物品图生成的物品图层和至少基于文案生成的文案图层的图层信息;
将第一码序列输入到串联的卷积层和长短期记忆LSTM层,输出第二码序列,所述第二码序列代表生成的图片图层信息;
基于第二码序列,生成所述图片。
可选地,所述物品图层除了基于所述物品图之外,还基于图片生成要求生成;所述文案图层除了基于所述文案之外,还基于图片生成要求生成。
可选地,所述第一码序列包含代表所述物品图层的码串、和代表所述文案图层的码串,其中每个码串包括颜色代码、卷积神经网络CNN特征代码、主题风格代码、设计手法代码、元素种类代码、空间信息代码,分别用于表示该码串代表的图层的颜色特征、CNN特征、主题风格特征、设计手法特征、元素种类特征、空间信息特征。
可选地,所述颜色代码通过以下方式获得:
对该码串代表的图层的各像素的颜色进行聚类;
将所述颜色聚成的类的标识作为所述颜色代码。
可选地,所述对该码串代表的图层的各像素的颜色进行聚类包括:
将该码串代表的图层的各像素的颜色组成颜色向量;
确定该颜色向量与作为聚类中心的多个聚类基准颜色向量的距离;
将距离最小的聚类基准颜色向量作为聚类结果。
可选地,所述CNN特征代码通过以下方式获得:
将该码串代表的图层输入CNN,由所述CNN输出所述CNN特征代码。
可选地,所述主题风格代码通过以下方式获得:
如所述图片生成要求中指示主题风格,将指示的主题风格转换成所述主题风格代码;
如所述图片生成要求中未指示主题风格,将该码串代表的图层的各像素的颜色输入主题风格机器学习模型,由所述主题风格机器学习模型输出主题风格代码。
可选地,所述设计手法代码通过以下方式获得:
如所述图片生成要求中指示设计手法,将指示的设计手法转换成所述设计手法代码;
如所述图片生成要求中未指示设计手法,将该码串代表的图层的各像素的颜色输入设计手法机器学习模型,由所述设计手法机器学习模型输出设计手法代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010225699.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:夹持装置
- 下一篇:一种机器人手臂及机器人