[发明专利]文本的摘要生成方法、装置、电子设备及可读介质在审
| 申请号: | 202111277688.4 | 申请日: | 2021-10-29 |
| 公开(公告)号: | CN114090731A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 涂曼姝;龚能 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F40/194 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 摘要 生成 方法 装置 电子设备 可读 介质 | ||
1.一种文本的摘要生成方法,其特征在于,包括:
获取预设文本,所述预设文本包括若干个原始文本句;
确定各所述原始文本句与其他文本句之间的相关性分值;
根据所述相关性分值,从各所述原始文本句中提取候选文本句;
根据所述候选文本句,生成所述预设文本对应的目标文本摘要。
2.根据权利要求1所述的方法,其特征在于,所述确定各所述原始文本句与其他文本句之间的相关性分值,包括:
将所述原始文本句输入语句相关性模型,获得所述原始文本句与所述预设文本中其他文本句之间的相关性分值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述相关性分值,从各所述原始文本句中提取候选文本句,包括:
采用所述原始文本句的各相关性分值,生成所述原始文本句的语句分值;
将所述预设文本中语句分值大于或等于预设分值阈值的原始文本句作为所述预设文本的候选文本句。
4.根据权利要求1所述的方法,其特征在于,所述根据所述候选文本句,生成所述预设文本对应的目标文本摘要,包括:
根据各个所述候选文本句的所述语句分值与对应的各个所述相关性分值,确定起始文本句以及至少一个关联文本句;
采用所述起始文本句与所述至少一个关联文本句,生成所述预设文本对应的目标文本摘要。
5.根据权利要求4所述的方法,其特征在于,所述根据各个所述候选文本句的所述语句分值与对应的各个所述相关性分值,确定起始文本句以及至少一个关联文本句,包括:
将所述预设文本中语句分值最大的候选文本句作为起始文本句;
将所述预设文本中位于所述起始文本句之后的候选文本句作为目标文本句;
根据所述起始文本句的相关性分值、各所述目标文本句与所述目标文本句的相关性分值,确定至少一个关联文本句。
6.根据权利要求5所述的方法,其特征在于,所述根据所述起始文本句的相关性分值、各所述目标文本句与所述目标文本句的相关性分值,确定至少一个关联文本句,包括:
将与所述起始文本句对应的相关性分值最高的候选文本句作为与所述起始文本句关联的关联文本句;
判断所述关联文本句在预设文本中是否存在位于所述关联文本句之后的候选文本句;
若在所述预设文本中所述关联文本句之后存在候选文本句,则将与所述关联文本句对应的相关性分值最高的候选文本句作为新的关联文本句,并返回所述判断所述关联文本句是否存在位于所述关联文本句之后的候选文本句的步骤;
当所述目标文本句中所有候选文本句遍历完毕时,获得至少一个关联文本句。
7.根据权利要求6所述的方法,其特征在于,所述判断所述关联文本句在预设文本中是否存在位于所述关联文本句之后的候选文本句之后,所述方法还包括:
若在所述预设文本中不存在位于所述关联文本句之后的候选文本句,则停止对所述目标文本句的遍历,获得至少一个关联文本句。
8.根据权利要求6所述的方法,其特征在于,所述当所述目标文本句中所有候选文本句遍历完毕时,获得至少一个关联文本句之前,所述方法还包括:
获取所述起始文本句与所述关联文本句组成的当前文本摘要,并获取所述当前文本摘要的第一文本长度;
采用预设文本阈值与所述预设文本的文本长度,确定第二文本长度;
若所述文本长度大于或等于所述第二文本长度,则停止对所所述目标文本句进行遍历,并将所述当前文本摘要作为所述预设文本的目标文本摘要。
9.一种文本的摘要生成装置,其特征在于,包括:
预设文本获取模块,用于获取预设文本,所述预设文本包括若干个原始文本句;
相关性确定模块,用于确定各所述原始文本句与其他文本句之间的相关性分值;
候选文本句确定模块,用于根据所述相关性分值,从各所述原始文本句中提取候选文本句;
文本摘要生成模块,用于根据所述候选文本句,生成所述预设文本对应的目标文本摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111277688.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理的方法和装置
- 下一篇:结构图的结构还原方法和装置





