[发明专利]一种多任务学习的商品评论标签自动生成方法、装置及系统有效
| 申请号: | 201911396009.8 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111325571B | 公开(公告)日: | 2023-08-18 |
| 发明(设计)人: | 李建欣;毛乾任;孙睿;李熙;黄洪仁;董善为 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06Q30/0282 | 分类号: | G06Q30/0282;G06F18/214;G06F18/24;G06F16/35 |
| 代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 任务 学习 商品 评论 标签 自动 生成 方法 装置 系统 | ||
一种多任务学习的商品评论标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于Transformer encoder的评论源文本特征编码器;步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;步骤四:基于Transformer decoder实现多任务的评论摘要生成器模型;步骤五:训练数据并根据联合loss函数进行训练调优,并实现模型封装与装置的接口实现;本发明避免采用抽取式的方式去生成评论标签,即不需要依赖句法结构的人工的规则集不能适合多个领域场景的缺点,又能保证标签生成的高效性,即只需要输入源文本,本发明装置能够自动产生标签。
技术领域
本发明涉及人工智能领域,尤其涉及一种多任务学习的商品评论标签自动生成方法、装置及系统。
背景技术
随着互联网迈入WEB2.0时代,人们不只是网络信息的消费者,更是网络信息的生产者。现如今人们在互联网上发表自己对商品、服务、时事的评价等观点信息变得越来越容易。在这种趋势下,对于网络评论的挖掘成为当前研究热点。在线评论是消费者做出购买决策的最主要因素,此外,在线评论作为反馈数据也能帮助企业提升产品以及了解用户需求。然而,评论数据量的飞速增长,加上评论数据本身具有不规范性、冗余性的特征,使得有用数据评论信息难以获取。因此,迫切需要一种能够高效准确地提取评论数据中有效信息的技术。
以往的商品标签生成的当时一般是基于商品方面及其情感的抽取式方式,即抽取出商品的某一个方面,比如华为手机在分辨率、价格、续航等方面,并识别出商品方面的情感。最后组织成商品标签如:分辨率高,价格便宜、续航持久。目前普遍使用的用户评论的观点提取和聚类的方法主要是基于规则的提取和K-means、LDA等传统方法。在基于规则的观点提取方法中,用户的评论中观点陈述句具有固定的句式结构,通过句法分析工具以及规则可以简单有效地抽取到用户评论中的观点。但是这种抽取观点的方法只对部分观点有效,因为依赖人工总结出来的规则不能涵盖所有用户评论中的表述方式。同时,这种方法仅对陈述句有效,中文会有很多种表达方式,因而这种方法无法直接适用。对于文本常用的聚类方法主要是以LDA为代表的主题模型和以K-means为代表的传统聚类方法。这些传统方法的好处在于模型简单,当样本较多时能够在较短的时间内收敛。但这些方法都是初值敏感的,即聚类的尺度无法控制,同一个类别下的共性可能不是语义上的相似性。同时,对于不同类别不同极性的商品评论观点用同一个标签并不适用。因此,无论是观点抽取,还是对观点进行聚合都有可以提升的空间,在观点抽取部分可提升召回率,在观点聚合部分可提升准确率,从而生成更加合理准确的商品评论标签。
综上,目前普遍的方式存在一定的缺点,首先命名实体识别并不适用于商品方面的词的识别,基于规则的方式并不适合于领域扩展比如在手机商品的评论对象抽取的pattern不试用于在家具商品上的对象抽取。一些基于神经网络模型建模的方法多采取基于商品的方面于情感的联合抽取方式,存在错误累积问题。
发明内容
由于抽取式文本摘要具备相对于生成式文本摘要更加优越的性能,特别是针对长文本摘要的应用场景,抽取式文本摘要研究仍然备受瞩目,也更能够直接应用于现实场景的开发实现,而目前已有的工作并没有从语义理解这个角度进行抽取式文本摘要的建模,造成抽取出的摘要存在偏离源文核心语义的现象。本发明正是针对深度语义理解表征的抽取式问文本摘要进行深入研究,提高抽取式文本摘要方法在语义理解上的壁垒,提升摘要性能。
为达到上述目的,本发明采用了下列技术方案:
一种多任务学习的商品评论标签自动生成方法,包括:
步骤一:构建训练数据集合与数据预处理;
步骤二:实现基于Transformer encoder的评论源文本特征编码器;
步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911396009.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于输电线路铁塔组立的单摇臂内拉线抱杆
- 下一篇:一种新型恒力支吊架





