[发明专利]基于评论文本挖掘的产品特征结构树构建方法有效

专利信息
申请号: 201610911734.4 申请日: 2016-10-19
公开(公告)号: CN106649260B 公开(公告)日: 2022-01-25
发明(设计)人: 徐新胜;林静;朱凡凡;马志斌 申请(专利权)人: 中国计量大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06F16/35
代理公司: 暂无信息 代理人: 暂无信息
地址: 310018 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 评论 文本 挖掘 产品 特征 结构 构建 方法
【说明书】:

发明提出了一种基于评论文本挖掘的产品特征结构树构建方法,为数据挖掘研究提供了一种新颖、有效的方法。该方法的步骤如下:1,语料库的获取;2,产品特征的提取;3,产品特征结构树的构建;4,产品特征的定量分析;5,产品特征结构树的扩展。目前,关于评论文本的获取、产品特征的提取等技术都已较为成熟,但对提取的产品特征并没有进行深入的研究。而本发明旨在研究产品特征之间的关系和其对产品质量特性的反应,为产品特征提取之后的研究拓展了方向、提供了思路。利用本发明的方法,制造企业可以快速、有效地了解用户反馈的使用产品信息,有助于企业与消费者之间建立对话,帮助企业进行产品设计的改进,扩大市场占有率。

技术领域:

本发明属于产品质量管理领域,涉及一种基于评论文本挖掘的产品特征结构树构建方法。

背景技术:

产品的质量安全问题是当今社会的永恒课题,它不仅包含产品的本质安全,也包含了产品的使用安全。产品的质量安全问题不仅影响消费者的权益(生命、财产、健康等),也会给制造企业带来巨大的经济损失,关系到制造企业的生存和发展。运用科学的、高效的管理方法和手段,尽早发现各种潜在的产品质量安全问题,通过技术创新和技术突破,对产品存在的问题进行改进和提升,提高产品在市场上的竞争力和影响力。

随着互联网技术的发展与普及,网络正逐渐改变着人们的生活和表达方式。由于不同的用户有不同的质量、安全需求,也可能在不同的环境、工况、负载下,产品在使用过程中会暴露出很多意料之外的质量安全问题,用户通常会选择借助网络平台进行交流,发表使用评价信息。这些用户的评价信息蕴含着丰富的、有价值的信息。制造企业如果能够快速、有效地从中提取反映产品质量的信息,将会为改进、完善产品开发设计提供重要的依据,提高用户的满意度,增强企业的市场竞争力,同时,也会降低由于产品质量问题造成事故给企业带来的经济损失。

然而,由于互联网的开放性,用户对产品质量安全的评价信息具有多源、异构的特点,面对纷繁复杂的海量网络评论数据,亟需一种机制做正确的监测,科学地分析各种潜在的质量问题,建立完善的质量安全监管技术体系,从而有效规避产品质量安全问题给企业带来的经济、信誉等损失,增强制造企业应对产品质量安全风险的能力。

发明内容:

为了能快速、有效地从多源异构的海量产品质量安全信息中提取产品特征,且对其进行产品特征结构树构建、定量描述、结构树扩展等操作,本发明提供了一种基于评论文本挖掘的产品特征结构树构建方法,是一种高效的、便捷的产品质量管理的方法,也是对传统产品质量管理方法的一种扩充。

本发明解决其技术问题所采用的技术方案如下述内容:

基于评论文本挖掘的产品特征结构树构建方法,其特征在于:该方法包括下述步骤:

步骤1,语料库获取:利用网络爬虫软件,制定爬取规则,抓取与指定产品相关的电商网站以及论坛上的用户评论文本进行预处理并以结构化形式保存到数据库中;

步骤2,产品特征提取:2.1利用分词器对语料库进行分词及词性标注,从初次分词结果中通过新词发现方法,识别领域新词,添加到用户词典中,再基于用户词典对语料库进行优化分词;2.2将优化分词结果进行词性标注集转换,用中文自然语言处理工具包对转换后的优化分词结果进行依存关系分析;2.3用整理的情感词词典对依存关系分析结果中的支配词进行标注,得到以词语为基本记录单元的结构化数据;2.4将情感分析的结果分为训练集和测试集,制定条件随机场特征模板,利用开源工具包,对已经标注产品特征的训练集进行训练,生成条件随机场模型,再利用该模型对测试集进行产品特征标注,并对测试结果进行评测;2.5从语料库中将标记的产品特征提取出来;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610911734.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top