[发明专利]一种长文本生成方法、装置及电子设备有效
申请号: | 202111565703.5 | 申请日: | 2021-12-21 |
公开(公告)号: | CN113987156B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 王卓然;沈寓实 | 申请(专利权)人: | 飞诺门阵(北京)科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06K9/62;G06F40/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 生成 方法 装置 电子设备 | ||
1.一种长文本生成方法,其特征在于,所述方法包括:
获取目标问题文本;
从预设文章数据库中,检索所述目标问题文本的相关文本;所述相关文本中包括至少一个候选句子;
确定所述候选句子在所述相关文本中的文本内重要性参数;
从所述预设文章数据库中,确定所述相关文本的关联文本;
确定所述候选句子出现在所述关联文本中的文本间重要性参数;
将所述候选句子作为输入,通过训练后的第一模型,输出所述候选句子应出现在答复长文本的概率参数;
根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数和所述概率参数,从所有的所述候选句子中,选出应出现在答复长文本的目标句子;
将选出的所述目标句子作为输入,通过训练后的第二模型,输出针对所述目标问题文本的答复长文本。
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数和所述概率参数,从所有的所述候选句子中,选出应出现在答复长文本的目标句子之前,还包括:
确定每个所述候选句子在所述相关文本中的出现位置;
确定每个所述候选句子在所述相关文本中与上下文的关系;
相应的,所述根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数和所述概率参数,从所有的所述候选句子中,选出应出现在答复长文本的目标句子,包括:
根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数、所述概率参数、所述出现位置和所述与上下文的关系,从所有的所述候选句子中,选出应出现在答复长文本的目标句子。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用于训练所述第一模型的多个第一问题训练文本,以及所述第一问题训练文本对应的第一人工答复文本;所述第一人工答复文本中包括至少一个第二句子;
从所述预设文章数据库中,检索每个所述第一问题训练文本的第一相关训练文本;所述第一相关训练文本中包括至少一个第一句子;
对于针对同一所述第一问题训练文本的所述第一相关训练文本和所述第一人工答复文本,确定每个所述第一句子分别与每个所述第二句子之间的语义相似度;
根据所述语义相似度,确定与每个所述第二句子相似的第一句子;
将与每个所述第二句子相似的第一句子作为正例,将所述第一相关训练文本中的其余第一句子作为负例,获得第一训练集;
通过所述第一训练集,对所述第一模型进行训练,得到训练后的第一模型。
4.根据权利要求3所述的方法,其特征在于,所述将与每个所述第二句子相似的第一句子作为正例,将所述第一相关训练文本中的其余第一句子作为负例,获得第一训练集,包括:
对每个所述第一句子分别进行特征提取,得到每个所述第一句子的特征向量;
将与每个所述第二句子相似的第一句子的特征向量作为正例的输入,将1作为所述正例的输出,将所述第一相关训练文本中的其余第一句子的特征向量作为负例的输入,将1作为所述负例的输出,获得第一训练集。
5.根据权利要求4所述的方法,其特征在于,所述第一句子的特征向量包括所述第一句子的句子向量、句子长度、句子与对应的所述第一问题训练文本之间的相似度,以及句子在所在段落中的位置中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞诺门阵(北京)科技有限公司,未经飞诺门阵(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111565703.5/1.html,转载请声明来源钻瓜专利网。