[发明专利]文本的生成方法、装置、存储介质及计算机设备在审
申请号: | 202110482749.4 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113111664A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 常永炷;张荣升;毛晓曦;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 徐世俊 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 生成 方法 装置 存储 介质 计算机 设备 | ||
本申请实施例公开了一种文本的生成方法、装置、存储介质及计算机设备。该方法包括:获取本体;根据所述本体的语义,确定所述本体对应的至少一个本体属性词汇;从预设的喻体集合中,确定与所述本体属性词汇相匹配的至少一个目标喻体;根据所述本体和所述目标喻体,生成至少一个目标文本。本申请实施例能够提高文本的多样性,且提高文本生成效率和生成效果。
技术领域
本申请涉及计算机技术领域,具体涉及一种文本的生成方法、装置、存储介质及计算机设备。
背景技术
现有技术中,通过收集常见的比喻句,从比喻句中提取主体和喻体作为训练样本,训练一个模型,通过该模型将主体和喻体进行配对,生成比喻句。但是,这种从比喻句中提取主体和喻体作为训练样本的方式,使得生成的比喻句比较常见,而且比喻句中提取的主体一般为词语,使得生成的比喻句形式单一。另外,模型训练需要大规模标注语料,耗时较长,效率较低,生成效果也不理想。
发明内容
本申请实施例提供一种文本的生成方法、装置、存储介质及计算机设备,能够提高文本的多样性,且提高文本生成效率和生成效果。
本申请实施例提供了一种文本的生成方法,包括:
获取本体;
根据所述本体的语义,确定所述本体对应的至少一个本体属性词汇;
从预设的喻体集合中,确定与所述本体属性词汇相匹配的至少一个目标喻体;所述喻体集合包括至少一个喻体;
根据所述本体和所述目标喻体,生成至少一个目标文本。
可选的,所述根据所述本体的语义,确定所述本体对应的本体属性词汇,包括:
将所述本体输入至预先训练好的语言模型中,使所述预先训练好的语言模型根据所述本体的语义,输出第一预设数量的本体属性词汇。
可选的,所述方法还包括:
从预先构建的知识图谱中获取具有属性关系的三元组集合;所述属性关系表示所述本体或所述喻体与对应的属性词汇之间的关联关系;
根据所述三元组集合,训练所述语言模型,得到训练好的语言模型。
可选的,所述从预设的喻体集合中,确定与所述本体属性词汇相匹配的至少一个目标喻体,包括:
确定所述喻体集合中每个喻体对应的喻体属性词汇集合,得到至少一个喻体属性词汇集合;
从所述至少一个喻体属性词汇集合中,确定与所述本体属性词汇相匹配的目标喻体属性词汇集合;
将所述目标喻体属性词汇集合对应的喻体,作为与所述本体属性词汇相匹配的目标喻体。
可选的,所述从所述至少一个喻体属性词汇集合中,确定与所述本体属性词汇相匹配的目标喻体属性词汇集合,包括:
分别将所述至少一个喻体属性词汇集合中的每个喻体属性词汇集合作为候选集合,检测所述候选集合中是否具有与所述本体属性词汇相匹配的目标属性词汇;
若是,则将所述候选集合作为与所述本体属性词汇相匹配的目标喻体属性词汇集合。
可选的,所述检测所述候选集合中是否具有与所述本体属性词汇相匹配的目标属性词汇,包括:
若所述候选集合中具有与所述本体属性词汇相同的喻体属性词汇,则确定所述候选集合中具有与所述本体属性词汇相匹配的目标属性词汇,且所述候选集合中与所述本体属性词汇相同的喻体属性词汇为所述目标属性词汇;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110482749.4/2.html,转载请声明来源钻瓜专利网。