[发明专利]文本生成方法、装置、电子设备及可读存储介质有效
| 申请号: | 202011623657.5 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112733515B | 公开(公告)日: | 2022-11-11 |
| 发明(设计)人: | 尚尔昕;陈开江;王江月 | 申请(专利权)人: | 贝壳技术有限公司 |
| 主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/205 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨云云 |
| 地址: | 300457 天津市滨海新区经济技术开发*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 生成 方法 装置 电子设备 可读 存储 介质 | ||
本发明提供一种文本生成方法、装置、电子设备及可读存储介质,其中所述方法包括:获取初始文本,所述初始文本基于预定义的模板语法生成;基于所述模板语法,解析所述初始文本,获取与所述初始文本的结构相关的文本结构体;基于描述目标的知识图谱数据和所述文本结构体,生成针对所述描述目标的自然语言文本。本发明通过预定义模板语法,使得非开发用户可以根据模板语法自行生成逻辑缜密的初始文本,从而能够有效提高准确性,同时,通过基于模板语法解析该初始文本获得机器可识别的符号,能够利用机器自动快速的生成目标文本,从而能够有效提高开发效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种文本生成方法、装置、电子设备及可读存储介质。
背景技术
随着人工智能技术的发展和互联网时代用户对信息的需求的增加,如何大规模生成个性化内容及如何加速生成成为炙手可热的技术问题。自然语言生成(NaturalLanguage Generator,简称NLG)技术被广泛应用在智能写稿、智能回复、BI报告生成等多个热门应用中。
目前,在文本文档生成中,基于完全模板的生成方法被广泛应用,该方法的一般流程为:
首先,产品经理或运营人员描述产品需求,主要是文本触发的逻辑和条件;
然后,研发人员根据产品文档,将上述自然语言翻译成程序可执行的代码,生成代码;
最后,产品经理对生成结果进行验收,对不合理的地方补充或修改逻辑。
但是,由于由研发人员生成代码,上述处理过程至少存在如下问题:研发人员可能不熟悉产品需求,导致产品逻辑不够缜密,准确性不高;产品人员对生成结果验收不通过时需要研发人员反复补充、修改,开发效率低。
发明内容
本发明提供一种文本生成方法、装置、电子设备及可读存储介质,用以解决现有技术在进行文本生成时准确性不高且开发效率低的缺陷,实现有效提高文本准确性以及开发效率的目标。
本发明提供一种文本生成方法,包括:
获取初始文本,所述初始文本基于预定义的模板语法生成;
基于所述模板语法,解析所述初始文本,获取与所述初始文本的结构对应的文本结构体;
基于描述目标的知识图谱数据和所述文本结构体,生成针对所述描述目标的自然语言文本。
根据本发明一个实施例的文本生成方法,在所述获取初始文本之前,还包括:
获取所述模板语法中的关键字,所述关键字为与文本结构关联的关键字;
接收用户输入的自定义信息,并基于所述自定义信息和被引用的关键字,生成所述初始文本;
其中,所述被引用的关键字为生成所述初始文本时引用的所述模板语法中的关键字,所述自定义信息为用户输入的与所述被引用的关键字对应的信息。
根据本发明一个实施例的文本生成方法,所述解析所述初始文本,获取与所述初始文本的结构对应的文本结构体,具体包括:
读取所述初始文本的数据,并通过匹配所述模板语法,获取所述被引用的关键字;
基于所述被引用的关键字的类型,确定所述类型对应的解析策略,并基于所述解析策略,获取所述初始文本中所述类型对应的文本结构体。
根据本发明一个实施例的文本生成方法,所述关键字包括如下关键字中的至少一种:
行文结构关键字、段落依赖关键字、重命名关键字、子条件关键字和高亮关键字。
根据本发明一个实施例的文本生成方法,所述解析所述初始文本,获取与所述初始文本的结构对应的文本结构体,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳技术有限公司,未经贝壳技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011623657.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像识别的学生专注力的检测方法
- 下一篇:一种电缆管生产用内支撑模芯





