[发明专利]基于字符级卷积神经网络的民宿顾客意见挖掘方法有效
| 申请号: | 201910117188.0 | 申请日: | 2019-02-15 |
| 公开(公告)号: | CN109829166B | 公开(公告)日: | 2022-12-27 |
| 发明(设计)人: | 杨有;张振;罗凌;余平;尚晋 | 申请(专利权)人: | 重庆师范大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06Q30/02;G06Q50/12 |
| 代理公司: | 北京东方盛凡知识产权代理有限公司 11562 | 代理人: | 李娜 |
| 地址: | 400047 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 字符 卷积 神经网络 顾客 意见 挖掘 方法 | ||
本发明公开了基于字符级卷积神经网络的民宿顾客意见挖掘方法,包括以下步骤:构建网络爬虫,采集全部民宿评论建立出民宿字典、利用TF‑IDF对文本进行特征提取和向量化以及进行可视化的主题聚类、构建民宿主题词典、找出分句后文本内对应的评价条数、基于朴素贝叶斯的弱监督预分类、构建一维卷积核的卷积神经网络进行特征提取,得到情感极性、对感极性进行情感可视化以及验证模型;本发明方法可以从大量带有噪声和虚假的评论数据中挖掘隐藏在这些个性化评论中的情感和用户需求,将有助于企业组织和用户个人的决策行为,同时本发明方法从数据驱动的角度出发,可以挖掘出顾客在各个主题下的满意度情况,结果可为民宿经营者和监管者提供建议。
技术领域
本发明涉及民宿顾客意见挖掘方法领域,尤其涉及基于字符级卷 积神经网络的民宿顾客意见挖掘方法。
背景技术
顾客意见挖掘是对顾客需求和意见的分析,对顾客评论进行分析 有利于民宿服务的改进和迭代,由于民宿服务的无形性,民宿的在线 评论比其他种类信息来源的影响更大,因此,借助于顾客意见挖掘改 进服务质量,是快速积累竞争优势的关键,主流的顾客意见挖掘方式 有两种,一是针对结构化数据分析,即基于结构化数据,诸如调查问 卷、利克特量表、语义差别量表等,来获得可感知的、有效的属性; 二是针对非结构化数据分析,即通过自然语言处理技术、可视化技术 来分析数据自身的特点,在评论网站,论坛,博客和社交媒体中可以 获得大量表达意见的文本,并在情感分析系统的帮助下,这种非结构 化信息可以自动转换为结构化数据,即可以捕捉到表达关于产品、服 务、品牌、政治或人们可以表达意见的其他主题等。
民宿评论有着时效性强、上下文主题独立、观点明确、篇幅短小、 表达随意等特点,现有的顾客意见挖掘方式在如何高效挖掘隐藏于噪 声中的顾客观点和情感方面仍存在不足,无法满足实际需求,因此, 本发明提出基于字符级卷积神经网络的民宿顾客意见挖掘方法,以解 决现有技术中的不足之处。
发明内容
针对上述问题,本发明方法可以从大量带有噪声和虚假的评论数 据中挖掘隐藏在这些个性化评论中的情感和用户需求,将有助于企业 组织和用户个人的决策行为,同时本发明方法从数据驱动的角度出发, 可以挖掘出顾客在各个主题下的满意度情况,结果可为民宿经营者和 监管者提供建议,具有很强的通用性,对消费者、经营者和监督者具 体一定的实际利用价值。
本发明提出基于字符级卷积神经网络的民宿顾客意见挖掘方法, 包括以下步骤:
步骤一:在线民宿评论采集与预处理,构建网络爬虫,采集全部 民宿评论建立出民宿字典,然后利用哈工大开源LTP词性标注功能将 标点符号利用换行符进行替代,将评论中的主题句进行分解,形成主 题评价文本;
步骤二:主题聚类,利用TF-IDF对主题评价文本进行特征提取 和向量化之后,使用pyLDAvis对民宿评论进行可视化的主题聚类, 得到可视化聚类结果,再按照簇内相似度高,簇间相似度低的主题选 取标准选择初始文本文档数k,得到初始模型,再计算各主题t之间 的相关性;
步骤三:利用于民宿规范文件和可视化聚类结果辅助构建民宿主 题词典;
步骤四:通过属性词匹配的方式找出分句后主题评价文本内对应 的评价条数,然后对对应主题的评价条数进行统计;
步骤五:基于朴素贝叶斯的弱监督预分类,通过网络爬虫自动标 注部分不具有追评的原评论,假设k为评论的关键词数,j为类别数, 评价有两类情感,通过对文本词频向量化的方式计算一个评价的后验 概率,输出概率大于0.5,即认为可预分类成功;
步骤六:基于C-CNN-SA的民宿评论情感分析,将字符级的非结 构化评论当做原始信号,按照字符进行去重,并按照字符频率进行降 序排列建立字符表,通过查询字符表中的的位置ID的方式将评论向 量化,并且构建一维卷积核的卷积神经网络进行特征提取,通过 softmax函数输出得到情感极性,通过Keras神经网络工具对本模型 的参数进行打印;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆师范大学,未经重庆师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910117188.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自媒体文章价值评估方法及系统
- 下一篇:一种分词处理方法和移动终端





