[发明专利]描述文本生成方法、装置、计算机设备和可读存储介质有效
申请号: | 201810907686.0 | 申请日: | 2018-08-10 |
公开(公告)号: | CN108959271B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 郑洁纯;郭丽娟;麦文军;钟雪艳 | 申请(专利权)人: | 广州太平洋电脑信息咨询有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/166;G06F16/33 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 510665 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 描述 文本 生成 方法 装置 计算机 设备 可读 存储 介质 | ||
本发明涉及一种描述文本生成方法,所述方法包括:获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。本发明方案能够自动生成与真人撰写相似的文本描述,显著提高描述文本生成效率。
技术领域
本发明涉及计算机技术领域,特别是涉及一种描述文本生成方法、装置、计算机设备和可读存储介质。
背景技术
市场很多行业需要大量的行情文章、促销信息、导购文章、新产品上市等文本描述,例如汽车行业,据统计,汽车经销商1天发布促销行情文章超5000篇,行业经销商、生产厂商、内容编辑者迫切希望能将数据量进一步扩大。
目前文本描述仍然采用人工撰写的方式,存在耗时长、成本高且效率低的问题。
发明内容
本发明的目的在于提供一种描述文本生成方法、装置计算机设备和可读存储介质,能够自动生成与真人撰写相似的文本描述,显著提高描述文本生成效率。
本发明的目的通过如下技术方案实现:
一种描述文本生成方法,所述方法包括:
获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语;
结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词语获取初始描述文本;
结合所述目标关键词信息和预设参数数据库,对所述初始描述文本进行修正获得目标描述文本。
在其中一个实施例中,所述目标关键词信息包括目标关键词以及与所述目标关键词对应的目标文本分值;
所述预设文本数据库中储存有多个属性词、与每一属性词对应的多个文本分值,以及与每一属性词对应的每一文本分值分别对应的多个样本描述文本,且每一样本描述文本的起始词语和结束词语分别设置有起始和结束标记;
所述预设参数数据库包括错误参数信息、每一所述属性词对应的标准参数以及与每一标准参数对应的多个待修正参数。
在其中一个实施例中,所述获取目标关键词信息,根据所述目标关键词信息从预设文本数据库中获取起始目标词语包括:
查询所述预设文本数据库中与所述目标关键词相同的属性词,获取与所查询到的属性词对应的多个文本分值;
查询所获取到的多个文本分值中与所述目标文本分值相同的文本分值,获取与所述文本分值对应的多个样本描述文本;
提取所获取到的多个样本描述文本中带有起始标记的多个起始词语,随机抽取一个起始词语作为所述起始目标词语。
在其中一个实施例中,所述结合所述起始目标词语和预设语言学习模型,依次获取多个目标词语,结合所获取到的多个目标词获取初始描述文本包括:
结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语;
当所述当前目标词语带有所述结束标记时,将已获取到的全部目标词语按照获取顺序依次连接形成所述初始描述文本;
当所述当前目标词语没有所述结束标记时,将所述当前目标词语作为新的上一目标词语,返回所述结合当前已获取的目标词语和所述预设语言学习模型获取与当前已获取的目标词语连接的当前目标词语的步骤。
在其中一个实施例中,所述结合所述目标关键词信息和预设参数信息,对所述初始描述文本进行修正获得目标描述文本包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州太平洋电脑信息咨询有限公司,未经广州太平洋电脑信息咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810907686.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的实体链接方法
- 下一篇:翻译方法、电子装置及存储介质