[发明专利]一种家装图片自动标注方法及系统有效
| 申请号: | 201911263427.X | 申请日: | 2019-12-11 |
| 公开(公告)号: | CN111191678B | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 陈旋;张平;付虹源;王刚 | 申请(专利权)人: | 江苏艾佳家居用品有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06V10/764;G06F40/289;G06F40/216;G06F40/30;G06F16/35;G06F16/55;G06F16/58 |
| 代理公司: | 南京新慧恒诚知识产权代理有限公司 32424 | 代理人: | 邓唯 |
| 地址: | 211100 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图片 自动 标注 方法 系统 | ||
1.一种家装图片自动标注方法,其特征在于,包括如下步骤:
第1步,获取家装客服的聊天信息数据,信息数据中包含有聊天文本信息以及聊天图片;
第2步,以聊天图片的前后各N句话以及图片是否与家装目标有关作为样本数据;采用人工神经网络模型,将图片之前的N句话和图片之后的N句话作为输入向量,以图片是否与家装目标有关作为输出向量,构建分类器,并训练模型;
第3步,采用实际的聊天样本数据,通过训练好的模型进行对所述实际的聊天样本数据中图片进行分类;
图片是否与家装目标有关是指图片是否归属于一种房间类型。
2.根据权利要求1所述的家装图片自动标注方法,其特征在于,所述的N为1-10的任意整数。
3.根据权利要求2所述的家装图片自动标注方法,其特征在于,所述的N为7。
4.根据权利要求1所述的家装图片自动标注方法,其特征在于,第2步中,需要对聊天图片中的前后文进行向量化处理。
5.根据权利要求1所述的家装图片自动标注方法,其特征在于,向量化处理的步骤包括:
S1,对前后文进行分词处理,并去除停用词;
S2,计算每个词的逆文本频率指数idf,其中idf=log(D/Dw),D是指含有单词的聊天语句的数量,Dw是聊天语句的总数;
S3,计算出每个词的词频tf,其中tf=f/fw,f为单词在聊天文本中出现的次数,fw为聊天文本中词的总数量;
S4,对于每个词,用该词的tf乘以idf,得到tf-idf值,将tf-idf值从大到小排序,选择最大的k个词再通过word2vector转为词向量。
6.根据权利要求1所述的家装图片自动标注方法,其特征在于,第2步中,采用的神经网络模型的结构中包括:
输入层,用于接收向量化处理后得到的词向量;
卷积层,连接于输入层,用于对输出层得到的值进行卷积处理;
池化层,连接于卷积层,用于对卷积层得到的值进行池化处理;
压平层,连接于池化层,用于对池化层得到的值进行一维化处理 ;
压平层通过隐藏层组连接到输出层。
7.根据权利要求6所述的家装图片自动标注方法,其特征在于,所述的输出层采用sigmoid函数。
8.一种家装图片自动标注系统,其特征在于,包括:
数据读取模块,用于获取家装客服的聊天信息数据,信息数据中包含有聊天文本信息以及聊天图片;
向量处理模块,用于对聊天图片中的前后文进行向量化处理;
处理模型模块,用于以聊天图片的前后各N句话经过向量处理模块后得到的向量以及图片是否与家装目标有关作为样本数据;将图片之前的N句话和图片之后的N句话经过向量处理模块后得到的向量作为输入向量,以图片是否与家装目标有关作为输出向量,构建分类器,并训练模型;
输出模块,用于采用实际的聊天样本数据,通过训练好的模型进行对所述实际的聊天样本数据中图片进行分类;图片是否与家装目标有关是指图片是否归属于一种房间类型。
9.一种计算机可读介质,其特征在于,其记载有可以运行权利要求1所述的家装图片自动标注方法的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏艾佳家居用品有限公司,未经江苏艾佳家居用品有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911263427.X/1.html,转载请声明来源钻瓜专利网。





