[发明专利]一种家装图片自动标注方法及系统有效

专利信息
申请号: 201911263427.X 申请日: 2019-12-11
公开(公告)号: CN111191678B 公开(公告)日: 2022-08-12
发明(设计)人: 陈旋;张平;付虹源;王刚 申请(专利权)人: 江苏艾佳家居用品有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06V10/774;G06V10/764;G06F40/289;G06F40/216;G06F40/30;G06F16/35;G06F16/55;G06F16/58
代理公司: 南京新慧恒诚知识产权代理有限公司 32424 代理人: 邓唯
地址: 211100 江苏省南京市江宁区*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图片 自动 标注 方法 系统
【说明书】:

发明涉及一种家装图片自动标注方法,特别涉及一种家装线上聊天场景下的图片自动标注方法。除对图片本身进行标注外,同时记录与图片相邻的N条上下文的文本内容,使用NLP分析文本内容来协助理解图片内容。这样标注出来的数据包含了更大的信息容量,仅通过少量标注的数据集也能够训练出一个相对准确的模型,再通过该模型自动识别新的图片后人工再审核后生成新的样本数据,重复这个过程可以大幅度提升图片内容标注数据的产生效率。这种标注方式确实与标准的图片标注方式相比增加了工作量,但通过较好的交互操作设计,增加的这部分工作量几乎可以忽略不计。

技术领域

本发明涉及一种家装图片自动标注方法,特别涉及一种家装线上聊天场景下的图片自动标注方法。

背景技术

家装行业作为典型的传统行业,想要完成整个行业的提档升级,完成互联网化、智能化的改造升级也就成了必经之路。其中,利用人工智能自动设别图片涵盖的各空间信息是家装业智能化升级的重要一步。深度学习做为处理图像视觉任务的强大工具在大部分场景下通过会获得比较理想的效果。然而构建一个使用监督学习实现多分类任务的图片识别模型需要大量的训练样本数据。虽然使用适用于图像深度学习的预训练模型可以一定程度上解决训练样本不足的问题,但预训练模型往往专注于普适性,对于特定领域下的支持能力较差,算法的使用者仍需要自己收集训练样本数据因此大量图片标注工作就成了摆在行业各企业面前的一个重要且紧急工作。

目前该工作训练样本数据基本通过投入大量标注人员的方式实现。首先,大量标注人员势必会极大增加企业的人力成本支出;其次,所有的标注结果都由人的主观判断产生,难免会造成标注质量的层次不齐,进而影响后面的模型训练质量;最后,技术快速迭代的场景下,人工标注效率无法大幅度提高,不能满足技术迭代需求,亟需提供提高标注效率的工具主要通过产生原始数据后进行人工标注来生成,由于原始数据的产生需要时间,有时很难在短时间内迅速收集到充足的数据以供训练使用,并且人工标注数据的效率较为低下,即使收集到了足够多的原始数据,还需要很长的标注时间,这样会导致模型迟迟无法完成训练,浪费企业的时间成本,因此如何帮助企业算法应用快速生成训练样本数据是一项重要且紧急的工作。

与一般的电商类应用不同,线上家装行业存在订单金额大,服务周期长,个性化要求多等特点,所以对于每一笔订单都需要客服人员的长期跟进,每天都会通过IM软件在线沟通产生大量的聊天数据。经过数据观察,用户与客服人员聊天的过程中会收发大量家装设计的图片内容,且这些图片内容往往与其出现位置的上下文呈现一定的信息相关性。这种相关性提供了一种独立与图片本身内容的数据维度,能够增加数据标注工作产生的信息量,通过这种信息量的增加,可以提升数据标注的效率。

发明内容

本发明为一种能够在聊天会话场景中,使用图片消息的上文信息,提升图片内容标注数据的产生效率的数据标注操作流程及相应的算法模型。

一种家装图片自动标注方法,包括如下步骤:

第1步,获取家装客服的聊天信息数据,信息数据中包含有聊天文本信息以及聊天图片;

第2步,以聊天图片的前后各N句话以及图片是否与家装目标有关作为样本数据;采用人工神经网络模型,将图片之前的N句话和图片之后的N句话作为输入向量,以图片是否与家装目标有关作为输出向量,构建分类器,并训练模型;

第3步,采用实际的聊天样本数据,通过训练好的模型进行样本中图片进行分类。

在一个实施方式中,所述的N为1-10的任意整数。

在一个实施方式中,所述的N优选为7。

在一个实施方式中,第2步中,需要对聊天图片中的前后文进行向量化处理。

在一个实施方式中,向量化处理的步骤包括:

S1,对前后文进行分词处理,并去除停用词;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏艾佳家居用品有限公司,未经江苏艾佳家居用品有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911263427.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top