[发明专利]一种基于用户评价的产品说明生成方法在审
| 申请号: | 202110104776.8 | 申请日: | 2021-01-26 |
| 公开(公告)号: | CN112818660A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 潘晓光;潘哲;焦璐璐;令狐彬;宋晓晨 | 申请(专利权)人: | 山西三友和智慧信息技术股份有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/216;G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06Q30/02 |
| 代理公司: | 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 | 代理人: | 杨凯;连慧敏 |
| 地址: | 030006 山西省*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 评价 产品 说明 生成 方法 | ||
1.一种基于用户评价的产品说明生成方法,其特征在于,包括下列步骤:
S100、基于规则过滤用户评价;
S200、基于多任务学习模型分类用户评价;
S300、计算候选句子相似度;
S400、生成产品说明。
2.根据权利要求1所述的一种基于用户评价的产品说明生成方法,其特征在于:步骤S100中,分析产品和用户评价之间的语言差异,建立如下规则识别不能用作产品说明的评价:
过于简短规则:仅包含3个以下单词的句子引入的有效信息过少;
人称规则:带有第一人称代词的句子;
特定于某一商家规则:涉及特定于商家的方面的评价。
3.根据权利要求1所述的一种基于用户评价的产品说明生成方法,其特征在于,步骤S200中,多任务学习模型依赖于人工标注,要求标注人员核验用户评价能否作为产品说明;
利用多任务学习模型,将用户评价的分类任务划分为1个主要任务和4个辅助任务,多任务学习模型中所有的任务共享LSTM层,仅前馈网络各自独立;
给定一个用户评价句子,首先使用预训练的word2vec词嵌入{w1,w2,w3,…,wn},然后使用共享的LSTM编码器生成评价语句的隐层表示{h1,h2,h3,…,hn},然后,将这种隐层表示形式并行传入5个完全独立的前馈网络,最终当主要任务判断为“能”且4个辅助任务判断为“否”时,用户评价能作为产品说明。
4.根据权利要求3所述的一种基于用户评价的产品说明生成方法,其特征在于,在标注人员核验用户评价中,对于不能作为产品说明的评价,需要标注原因。
5.根据权利要求3所述的一种基于用户评价的产品说明生成方法,其特征在于,主要任务包括用户评价是否能作为产品说明;辅助任务包括用户评价是否过于主观、缺少上下文、特定于某一商家和内容过于简要。
6.根据权利要求1所述的一种基于用户评价的产品说明生成方法,其特征在于,步骤S300中,通过识别语义相似的用户评价,以增加最终产品说明的多样性;通过爬取部分产品说明,确定用户评价的相似度阈值,并计算产品说明中每对句子之间的相似度,并将第90个百分数视为阈值θ。
7.根据权利要求5所述的一种基于用户评价的产品说明生成方法,其特征在于,其中句子的表示采用词加权方法,权重使用TF-IDF。
8.根据权利要求1所述的一种基于用户评价的产品说明生成方法,其特征在于,步骤S400中,使用如下步骤得到产品说明:
步骤1、候选用户评价按照分类分数降序排序;
步骤2、从排序后的候选用户评价中,选取排名第一的用户评价,选择与当前用户评价相似度小于阈值θ的评价,与当前评价共同加入结果,并从候选用户评价中删除;
步骤3、如果挑选出的用户评价数量达到要求,则输出结果;如果还未达到要求,则重复第2步。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110104776.8/1.html,转载请声明来源钻瓜专利网。





