[发明专利]食药舆情分析方法有效

专利信息
申请号: 202110498441.9 申请日: 2021-05-08
公开(公告)号: CN113378578B 公开(公告)日: 2023-04-18
发明(设计)人: 莫军;杨小珊;黄先亮;谭明天;詹洪胜;许晶冰;毛庆;谭敏;高中华;王自强;唐运涛 申请(专利权)人: 重庆航天信息有限公司;重庆市食品药品检验检测研究院
主分类号: G06F40/30 分类号: G06F40/30;G06F16/33;G06F16/36;G06F16/953;G06N3/0442
代理公司: 北京海虹嘉诚知识产权代理有限公司 11129 代理人: 胡博文
地址: 400039 重庆市九*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 舆情 分析 方法
【说明书】:

发明提供的一种食药舆情分析方法,包括:采集网络文本,并对网络文本进行预处理;对预处理后的网络文本进行分句处理,并剔出网络文本中的重复评论句;对分句处理后的每个评论句进行分词处理,提取出文本中的食药特征词;计算食药特征词之间的相似度,任意两个相似度小于设定阈值,则剔除其中一个特征词;构建分类词典,将每个评论句中的食药特征词划分到所对应的词典类别;构建情感词典,并从评论句中识别出食药特征词、情感词、程度词以及否定词;确定情感词的基础情感值,程度词的权重值以及否定词的权重值;构建食药情感倾向值计算模型,并根据情感倾向值计算模型确定所采集网络文本的舆情倾向,通过上述方法,能够对用户发表在网络上的评价进行准确处理,并得出准确的情感倾向值,从而能够为食药的厂家、质量监督部门提供准确的舆情参考依据,从而为质量反馈、市场监督的措施制定提供准确的数据支持。

技术领域

本发明涉及一种舆情分析方法,尤其涉及一种食药舆情分析方法。

背景技术

食品和药物是关系到民生的两大主题,市面上的食品以及药物的种类不胜枚举,然而,用户对于某个品牌的食品或者药物的使用后的评价,则是关系到后续对于食品以及药物的质量反馈、市场监督等行为的实施。

随着网络技术和计算机技术的发展,用户对于食品或者药物的评价往往通过微博、贴吧等网络方式进行陈述,现有技术中,对于关于食药舆情的网络文本的分析均是基于情感分析,即通过对网络文本的处理、情感值计算等,但是,现有的情感分析方法存在准确性低,从而不能准确的把握用户评价倾向。

因此,为了解决上述技术问题,亟需提出一种新的技术手段。

发明内容

有鉴于此,本发明的目的是提供一种食药舆情分析方法,能够对用户发表在网络上的评价进行准确处理,并得出准确的情感倾向值,从而能够为食药的厂家、质量监督部门提供准确的舆情参考依据,从而为质量反馈、市场监督的措施制定提供准确的数据支持。

本发明提供的一种食药舆情分析方法,包括以下步骤:

S1.采集网络文本,并对网络文本进行预处理;

S2.对预处理后的网络文本进行分句处理,并剔出网络文本中的重复评论句;

S3.对分句处理后的每个评论句进行分词处理,提取出文本中的食药特征词;计算食药特征词之间的相似度,任意两个相似度小于设定阈值,则剔除其中一个特征词;

S4.构建分类词典,将每个评论句中的食药特征词划分到所对应的词典类别;

S5.构建情感词典,并从评论句中识别出食药特征词、情感词、程度词以及否定词;

S6.确定情感词的基础情感值,程度词的权重值以及否定词的权重值;

S7.构建食药情感倾向值计算模型,并根据情感倾向值计算模型确定所采集网络文本的舆情倾向。

进一步,步骤S1中,具体包括:

S11.对网络文本进行有序化处理,并剔除网络文本中的停用词、无关词;

S12.对步骤S1中处理后的网络文本进行指代消解:

S121.基于fasttext分类模型对网络文本进行指代词检测;

S122.基于BiLSTM_CRF深度学习模型进行网络文本中的实体词进行提取;

S123.将网络文本的指代词替换成相对应的实体词。

进一步,步骤S3中,食药特征词之间的相似度通过如下方法计算:

其中,β为食药特征词A和食药特征词B之间的相似系数;Dis(A,B)为食药特征词A和食药特征词B之间的语义距离,其中,β≥1.5。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆航天信息有限公司;重庆市食品药品检验检测研究院,未经重庆航天信息有限公司;重庆市食品药品检验检测研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110498441.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top