[发明专利]一种长文本生成方法、装置及电子设备有效
申请号: | 202111565703.5 | 申请日: | 2021-12-21 |
公开(公告)号: | CN113987156B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 王卓然;沈寓实 | 申请(专利权)人: | 飞诺门阵(北京)科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06K9/62;G06F40/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 生成 方法 装置 电子设备 | ||
本发明实施例提供了一种长文本生成方法、装置及电子设备,属于文本处理技术领域。该方法包括:对于用户提出的目标问题,可以检索与目标问题相关的专业文章,并确定文章中每个句子的文章内重要性参数、文章间重要性参数以及应出现在答复长文本的概率参数,然后可以根据上述参数,从文章的句子中,选出应出现在答复长文本的目标句子,进而将选出的目标句子输入训练后的第二模型,从而可以自动生成针对目标问题的答复长文本。该答复长文本是将针对目标问题搜索到的专业性句子进行合理化整合得到的,因而具有较强的专业性及逻辑性。本发明实施例中,无需人工生产答复长文本,提高了自动答复的效率,节约了人力和成本。
技术领域
本发明涉及文本处理技术领域,特别是涉及一种长文本生成方法、装置及电子设备。
背景技术
自动问答系统可以根据用户的问题,自动找到答案反馈给用户,可以应用于诸多场景,例如自动客服替代人工解答客户疑问的场景,在语音助手回答百科知识等问题的场景等,自动问答系统能够提升用户查找知识的效率。
然而,目前的一些自动问答系统基本只能够回复短文本,最多是从文章中摘取一段文本回复。而在医学科普、儿童教育等领域的实际应用中,短文本所包含的信息量极其有限,实际场景往往需要根据用户提问,产生一篇数百字以上的、具有条理结构的解答文章。解答文章的内容不仅回答用户的问题,还需要补充相应的背景知识,以便用户理解解答文章的内容。实际应用中,这类解答文章仍需依赖领域专家人工进行生产,效率低,人力成本高。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种长文本生成方法、装置及电子设备。
根据本发明的第一方面,提供了一种长文本生成方法,所述方法包括:
获取目标问题文本;
从预设文章数据库中,检索所述目标问题文本的相关文本;所述相关文本中包括至少一个候选句子;
确定所述候选句子在所述相关文本中的文本内重要性参数;
从所述预设文章数据库中,确定所述相关文本的关联文本;
确定所述候选句子出现在所述关联文本中的文本间重要性参数;
将所述候选句子作为输入,通过训练后的第一模型,输出所述候选句子应出现在答复长文本的概率参数;
根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数和所述概率参数,从所有的所述候选句子中,选出应出现在答复长文本的目标句子;
将选出的所述目标句子作为输入,通过训练后的第二模型,输出针对所述目标问题文本的答复长文本。
可选地,所述根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数和所述概率参数,从所有的所述候选句子中,选出应出现在答复长文本的目标句子之前,还包括:
确定每个所述候选句子在所述相关文本中的出现位置;
确定每个所述候选句子在所述相关文本中与上下文的关系;
相应的,所述根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数和所述概率参数,从所有的所述候选句子中,选出应出现在答复长文本的目标句子,包括:
根据每个所述候选句子对应的所述文本内重要性参数、所述文本间重要性参数、所述概率参数、所述出现位置和所述与上下文的关系,从所有的所述候选句子中,选出应出现在答复长文本的目标句子。
可选地,所述方法还包括:
获取用于训练所述第一模型的多个第一问题训练文本,以及所述第一问题训练文本对应的第一人工答复文本;所述第一人工答复文本中包括至少一个第二句子;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞诺门阵(北京)科技有限公司,未经飞诺门阵(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111565703.5/2.html,转载请声明来源钻瓜专利网。