[发明专利]一种基于用户评价的产品说明生成方法在审
| 申请号: | 202110104776.8 | 申请日: | 2021-01-26 |
| 公开(公告)号: | CN112818660A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 潘晓光;潘哲;焦璐璐;令狐彬;宋晓晨 | 申请(专利权)人: | 山西三友和智慧信息技术股份有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/216;G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06Q30/02 |
| 代理公司: | 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 | 代理人: | 杨凯;连慧敏 |
| 地址: | 030006 山西省*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 评价 产品 说明 生成 方法 | ||
本发明涉及电子商务系统领域,具体涉及一种基于用户评价的产品说明生成方法,包括如下步骤:S100、基于规则过滤用户评价;S200、基于多任务学习分类用户评价;S300、计算候选句子相似度;S400、生成产品说明;本发明通过使用多任务学习方式,能够有效的提升用户评价是否能够作为产品说明的分类效果;结合基于规则过滤的方式,能够筛选出质量高的候选用户评价;结合候选评价句子相似度计算和产品说明生成算法,能够生成具有多样性的产品说明。
技术领域
本发明涉及电子商务系统领域,具体涉及一种基于用户评价的产品说明生成方法。
背景技术
如今产品说明在电子商务系统中起着重要作用,向买家传达他们可能购买的商品信息。但是,在电子商务网站上,每天都有大量新商品要出售,但是产品说明往往一无所有。用户评价旨在反映买方的观点,包含主观意见,而产品说明通常会反映卖方的观点,更多的是基于事实的客观信息。
发明内容
本发明的目的在于提供一种基于用户评价的产品说明生成方法。
为实现上述目的,本发明提供如下技术方案:一种基于用户评价的产品说明生成方法,包括下列步骤:
S100、基于规则过滤用户评价;
S200、基于多任务学习模型分类用户评价;
S300、计算候选句子相似度;
S400、生成产品说明。
进一步的,步骤S100中,分析产品和用户评价之间的语言差异,建立如下规则识别不能用作产品说明的评价:
过于简短规则:仅包含3个以下单词的句子引入的有效信息过少;
人称规则:带有第一人称代词的句子;
特定于某一商家规则:涉及特定于商家的方面的评价。
进一步的,步骤S200中,多任务学习模型依赖于人工标注,要求标注人员核验用户评价能否作为产品说明;
利用多任务学习模型,将用户评价的分类任务划分为1个主要任务和4个辅助任务,多任务学习模型中所有的任务共享LSTM层,仅前馈网络各自独立;
给定一个用户评价句子,首先使用预训练的word2vec词嵌入{w1,w2,w3,…,wn},然后使用共享的LSTM编码器生成评价语句的隐层表示{h1,h2,h3,…,hn},然后,将这种隐层表示形式并行传入5个完全独立的前馈网络,最终当主要任务判断为“能”且4个辅助任务判断为“否”时,用户评价能作为产品说明。
进一步的,在标注人员核验用户评价中,对于不能作为产品说明的评价,需要标注原因。
进一步的,主要任务包括用户评价是否能作为产品说明;辅助任务包括用户评价是否过于主观、缺少上下文、特定于某一商家和内容过于简要。
进一步的,步骤S300中,通过识别语义相似的用户评价,以增加最终产品说明的多样性;通过爬取部分产品说明,确定用户评价的相似度阈值,并计算产品说明中每对句子之间的相似度,并将第90个百分数视为阈值θ。
进一步的,其中句子的表示采用词加权方法,权重使用TF-IDF。
进一步的,步骤S400中,使用如下步骤得到产品说明:
步骤1、候选用户评价按照分类分数降序排序;
步骤2、从排序后的候选用户评价中,选取排名第一的用户评价,选择与当前用户评价相似度小于阈值θ的评价,与当前评价共同加入结果,并从候选用户评价中删除;
步骤3、如果挑选出的用户评价数量达到要求,则输出结果;如果还未达到要求,则重复第2步。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110104776.8/2.html,转载请声明来源钻瓜专利网。





