[发明专利]一种用户画像构建方法在审

专利信息
申请号: 201910452154.7 申请日: 2019-05-28
公开(公告)号: CN110209767A 公开(公告)日: 2019-09-06
发明(设计)人: 周庆;侯芬;胡月;葛亮;陈超;文举;尹畅;欧娇娇;王欢 申请(专利权)人: 重庆大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F17/27
代理公司: 北京康盛知识产权代理有限公司 11331 代理人: 陶俊洁
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 目标词 画像 量化结果 向量形式 类别词 构建 自然语言处理技术 文本 量化 评论文本 向量训练 余弦距离 弦距离 分类 求和 申请 分析
【说明书】:

本申请涉及一种用户画像构建方法,涉及评论文本分析和自然语言处理技术领域,包括:提取评价文本中的目标词和意见词;量化意见词,得到意见词的量化结果;将所述目标词进行分类:将各类别词和各所述目标词分别带入向量训练模型,得到有向量形式的类别词和有向量形式的目标词;计算各目标词与类别词之间的余弦距离;将最大余弦距离值所对应的目标词归入对应的类别中;对各类别下的目标词所对应意见词的量化结果进行求和,得到各类别的分值;根据各类别的分值得到用户画像。面对繁杂庞大的评价文本,通过量化意见词、对目标词进行分类并计算出各类别分值,准确地体现用户的喜厌程度,精准地得到用户画像,给用户带来更好的体验。

技术领域

本申请涉及大数据分析领域,尤其涉及评论文本分析和自然语言处理领域。

背景技术

随着互联网技术的流行,互联网用户每天都在互联网上产生大量数据,包括静态数据、动态数据,通过提取数据中的用户特征,建立用户画像是十分有意义的。通过建立用户画像有助于:理解用户,获得和分析用户的反馈,挖掘用户的潜在需求等,并为用户提供个性化服务。例如,在电商领域,通过收集用户的浏览、收藏、购买的商品信息,分析用户的消费行为,获得用户的消费偏好,并构建用户画像。针对不同用户的特征提供对应的服务,为用户带来更好的服务体验。

目前的研究中,常见的用户画像构建常常立足于用户行为的统计分析。比如电商例子中,通过统计用户浏览、收藏、加入购物车以及购买的几种行为进行统计,可以一定程度上得到用户更偏好在哪类商品,但只是统计意义上的规律,并不能够细致刻画用户的偏好,也不能够完全解释用户的偏好。而能够直接、具体、准确地反应用户喜恶以及对哪些方面喜好哪些方面厌恶,便是用户自己写下的评论。因此,对用户评论深入分析有利于更为精准地刻画用户画像,能给用户带来更好的体验,具有研究意义和应用价值。而用户的评论数据无疑是庞大的,人工逐条读取获得信息显然是不可能的,所以如何从大量评论文本中提取出用户意见观点是研究重点之一。

发明内容

为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。

根据本公开实施例的一个方面,提供了一种用户画像构建方法。

在一些可选实施例中,所述方法包括步骤:

提取评价文本中的目标词和意见词;

量化意见词,得到意见词的量化结果;

将所述目标词进行分类:将各类别词和各所述目标词分别带入向量训练模型,得到有向量形式的类别词和有向量形式的目标词;计算各目标词与类别词之间的余弦距离;将最大余弦距离值所对应的目标词归入对应的类别中;

对各类别下的目标词所对应意见词的量化结果进行求和,得到各类别的分值;

根据各类别的分值得到用户画像。

通过向量模型训练目标词和类别词,并计算具有向量的目标词和具有向量的类别词之间的余弦距离,通过最大余弦距离值将目标词归入对应的类别中,通过对各类别的目标词所对应意见词进行量化并求和方式,得到各类别的分值,通过各类别的分值得到用户画像。

在一些可选实施例中,所述步骤之前还包括如下步骤:

对评论文本进行预处理,包括:

清洗数据、筛除数据;

对评论文本进行分词、词性标注、依存句法分析。

通过对评论文本的清洗数据、筛除数据,使评论文本更准确地表达用户及评论对象的特征信息。

在一些可选实施例中,所述提取评价文本中的目标词和意见词,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910452154.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top