[发明专利]一种基于大数据的产品形象效果评估系统在审
申请号: | 201910667289.5 | 申请日: | 2019-07-23 |
公开(公告)号: | CN110705303A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 程博 | 申请(专利权)人: | 广东数鼎科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06K9/62;G06Q30/02 |
代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 颜希文;麦小婵 |
地址: | 510623 广东省广州市天河区华夏路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感倾向 喜好度 输入模块 词向量 向量化 量化 概率预测模型 准确度 语义 产品形象 广告宣传 获取目标 量化模块 模型模拟 提取模块 效果评估 大数据 向量 语料 车型 挖掘 评估 转化 宣传 | ||
1.一种基于大数据的产品形象效果评估系统,其特征在于,包括:
输入模块,用于获取目标产品的形象语料数据;
形象及情感倾向提取模块,用于通过语义挖掘技术对所述输入模块获取的数据进行各类形象词提取并判断情感倾向;
词向量化模块,所述词向量模块包括预先训练完成的词向量模型,所述词向量化模型用于将所述各类形象词转化为向量;
形象对喜好度作用量化模块,用于建立概率预测模型,量化每个形象词对喜爱度的影响数值。
2.如权利要求1所述的系统,其特征在于,所述输入模块包括输入原始语料子模块和输入模拟形象子模块;
所述输入原始语料子模块用于输入反应消费者真实想法的对于所述目标产品或者同类产品的评论语料;
所述输入模拟形象子模块用于输入待模拟的形象组合以及该组合中每个形象的占比数据。
3.如权利要求2所述的系统,其特征在于,所述形象及情感倾向提取模块包括词库和情感识别模型;
所述词库用于储存各种词汇,是分词工具的基础。分词工具基于词库可以对句子进行词语切分,提取关键词;
所述情感识别模型用于提取所述语料里每个短句的情感倾向;所述情感倾向包括正向、中性和负向。
4.如权利要求3所述的系统,其特征在于,所述词库包括经典词库和行业词库,所述经典词库用于储存日常经典形象词;所述行业词库用于储存目标产品相关的术语和基于行业语料提取的常用词。
5.如权利要求3所述的系统,其特征在于,所述情感识别模型在提取情感倾向之前,还可以自动更新模型:根据分类算法训练模型,提取每个短句的关键信息并用分类算法训练出所述关键信息与情感倾向的关系,完成建模或模型自动更新。
6.如权利要求5所述的系统,其特征在于,所述分类算法包括SVM算法、神经网络算法、逻辑回归算法和朴素贝叶斯算法等。所有分类算法均在本专利保护范围。
7.如权利要求3所述的系统,其特征在于,所述形象及情感倾向提取模块还包括加工子模块,所述加工子模块用于切割所述输入原始语料子模块输入的语料数据,以使所述语料数据被切割为多个带有情感倾向标签的短句。
8.如权利要求7所述的系统,其特征在于,所述加工子模块包括分词单元和标签单元,所述分词单元用于通过分词技术将原始语料切割成多个词,并识别出里面的形象词;所述标签单元用于将原始语料拆分成短句,每个短句作为情感模型的输入,再通过所述情感模型在每个短句上建立情感倾向的标签。
9.如权利要求3所述的系统,其特征在于,所述正向情感倾向和负向情感倾向分别分为多个等级,以区分正向情感或负向情感的强度。
10.如权利要求2所述的系统,其特征在于,所述形象对喜好度作用量化模块包括模拟子模块和建模子模块;
所述模拟子模块用于获取所述输入模拟形象子模块输入的形象组合,结合当前产品的舆情评论,模拟在各个形象词的提及百分比达到输入水平时,消费者对于具有该组形象的车型的喜好度;
所述建模子模块用于获取经过所述形象及情感倾向提取模块提取情感标签的短句,以及经所述词向量模块生成的短句中形象词的词向量,并对所述概率预测模型进行模型更新,在原有权重基础上叠加新数据训练得到更新的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东数鼎科技有限公司,未经广东数鼎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910667289.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:命名实体的识别方法、电子设备及计算机存储介质
- 下一篇:一种属性词提取方法