[发明专利]基于词向量表征的问题评论对的构建方法有效

专利信息
申请号: 201911229576.4 申请日: 2019-12-04
公开(公告)号: CN110968674B 公开(公告)日: 2023-04-18
发明(设计)人: 钱宇;袁华 申请(专利权)人: 电子科技大学
主分类号: G06F16/33 分类号: G06F16/33;G06F40/211;G06F40/30;G06Q30/0601
代理公司: 四川省成都市天策商标专利事务所(有限合伙) 51213 代理人: 张秀敏
地址: 610000 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 向量 表征 问题 评论 构建 方法
【说明书】:

发明公开了一种基于词向量表征的问题评论对的构建方法,包括以下步骤:获取问答语料库以及评论语料库,并对问题和该问题的回答进行拼接;使用word2vec工具和基于词向量的词袋模型分别对拼接后的问答语句以及评论进行表征,获得拼接后的问答语句的句向量以及评论语句的句向量;利用得到的句向量计算拼接后的问答语句以及评论语句间的相似度;对于每个问题,按照得到的相似度对评论进行排序,将相似度最高的n个评论作为该问题的候选评论;专家在每个问题的候选评论中进行标注,标注出可以回答问题的评论和不可以回答问题的评论,即可得到问题评论对。本发明可以有效的减少消费者在网上购物时的信息搜索成本。

技术领域

本发明涉及大数据挖掘技术领域,特别是一种基于词向量表征的问题评论对的构建方法。

背景技术

目前电子商务发展迅速,越来越多的人选择网上购物。在消费者购买决策的过程中,为了判断商品是否符合预期,需要收集商品相关的信息。在传统线下购物的过程中,消费者会对一些商品进行尝试来判断该商品是否符合预期。然而在网上购物时,由于无法接触到商品实物,消费者无法得到一手的商品信息。商家一般所提供的信息都是商品参数、型号等属性信息,很少会有一些体验相关的信息。同时为了能卖出更多的商品,极少会有商家提供自己商品负面信息。因此,如果商家是消费者信息的唯一来源,在购物时消费者将会面临较大的风险。消费者所购买到的商品可能会和商家宣传有一定的偏差。为了减少风险,阅读用户评论等其他信息获取渠道就变得十分重要。

Senecal等人在研究中发现,阅读评论是一个有效的获取商品信息,帮助消费者进行消费决策的手段。当消费者急需一款新手机,想知道手机送货快不快的时候,可以通过阅读评论找到答案。然而对于一些拥有海量评论的热销商品而言,从如此多的评论中找到消费者所需要的信息是十分费时费力的。

因此,很多消费者不愿意通过阅读评论来获取所需信息,而是通过在问答区内提问,希望买过商品的消费者回答这个问题,以此来获得所需信息。Banerjee等学者对电商问答区域研究发现,电商问答区域有效的帮助了消费者进行消费决策。但是并不是消费者所有的提问都会有人来回答,即使有人回答也不一定及时。虽然消费者的问题得到了回答,但是已经过去很多的时间。假设一名消费者在限时促销期间进行提问希望能以较低价格购买该商品,如果这个消费者得到的首个回答是在三天后,为了不错过促销活动,消费者只能在没有得到回答的情况购买商品。在这种情况下,这个回答对提问的消费者的意义就很小了。虽然对商家提问有时能很快的得到答复,但是商家几乎不会提供自己商品的负面信息。如果消费者由于信息获取成本过高而放弃进一步获取信息,在没有获得足够的信息的情况下进行购买了商品,很可能会出现商品与预期不符的情况。

从消费者方面看,商品的期望属性与真实属性间较大的差异会带来较差的购物体验,浪费消费者的时间和金钱。从商家方面看,消费者在申请售后时有也会耗费商家大量的人力物力,同时负面评价会降低商家在消费者中的口碑,不利于长期经营。从平台方面看,调解消费者和商家间的纠纷也会消耗较大的成本。

发明内容

为解决现有技术中存在的问题,本发明的目的是一种基于词向量表征的问题评论对的构建方法,本发明能在消费者提问时快速高效地给消费者提供其所需信息,可以减少消费者的信息搜索成本,帮助消费者进行消费决策。

为实现上述目的,本发明采用的技术方案是:一种基于词向量表征的问题评论对的构建方法,包括以下步骤:

S10、获取问答语料库以及评论语料库,并对问题和该问题的回答进行拼接;

S20、使用word2vec工具和基于词向量的词袋模型分别对拼接后的问答语句以及评论进行表征,获得拼接后的问答语句的句向量以及评论语句的句向量;

S30、利用步骤S20得到的句向量计算拼接后的问答语句以及评论语句间的相似度;

S40、对于每个问题,按照步骤S30得到的相似度对评论进行排序,将相似度最高的n个评论作为该问题的候选评论;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911229576.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top