[发明专利]文本摘要生成方法、装置、计算机设备及存储介质有效
| 申请号: | 202110679639.7 | 申请日: | 2021-06-18 |
| 公开(公告)号: | CN113254593B | 公开(公告)日: | 2021-10-19 |
| 发明(设计)人: | 李夏昕 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/34;G06F40/211;G06F40/242;G06F40/289;G06F40/30 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 摘要 生成 方法 装置 计算机 设备 存储 介质 | ||
1.一种文本摘要生成方法,其特征在于,包括:
响应于文本摘要生成指令,根据所述文本摘要生成指令获取待处理数据;
根据任务场景获取词典对所述待处理数据进行切分处理,得到多个分句;
计算所述多个分句中每两个分句间的相互推荐度;
计算所述多个分句中每两个分句间的语义相似度;
计算所述多个分句中每两个分句间的位置相似度,包括:将每两个分句确定为一组分句,其中,每组分句中的两个分句互为推荐句及被推荐句;当任意分句为所述被推荐句时,确定所述被推荐句在相应段落中的位置,当所述被推荐句在相应段落中排在前预设位或者后预设位时,确定对应的矩阵cell值为第一数值;当所述任意分句为所述推荐句时,确定所述推荐句在相应段落中的位置,当所述推荐句在相应段落中排在所述前预设位或者所述后预设位时,确定对应的矩阵cell值为第二数值;当任意组分句中的推荐句及被推荐句都在相应段落中排在所述前预设位或者所述后预设位时,确定对应的矩阵cell值为第三数值;当所述任意组分句中的推荐句及被推荐句都不在相应段落中排在所述前预设位或者所述后预设位时,确定对应的矩阵cell值为第四数值;当所述任意分句为所述被推荐句,且所述任意分句为指定属性时,确定对应的矩阵cell值为所述第一数值;根据所述矩阵cell值进行矩阵转换,得到每两个分句间的位置相似度;
对每两个分句间的相互推荐度、每两个分句间的语义相似度以及每两个分句间的位置相似度进行融合处理,得到图邻接矩阵;
将所述图邻接矩阵输入至TextRank算法计算每个分句的重要度;
根据每个分句的重要度进行筛选,得到备选分句;
对所述备选分句进行后处理,得到摘要句子。
2.根据权利要求1所述的文本摘要生成方法,其特征在于,所述根据任务场景获取词典对所述待处理数据进行切分处理,得到多个分句包括:
识别当前任务场景;
调取与所述当前任务场景匹配的词典作为目标词典;
根据所述目标词典切分所述待处理数据,得到所述多个分句。
3.根据权利要求1所述的文本摘要生成方法,其特征在于,所述计算所述多个分句中每两个分句间的相互推荐度包括:
根据接收到的配置需求配置所述多个分句中每个单词的词权重;
对于所述多个分句,获取每两个分句中同时出现的单词作为目标词;
确定所述目标词的词权重及词性;
根据所述目标词的词权重及词性计算每两个分句文本间的相似度,得到推荐度矩阵;
对所述推荐度矩阵执行L2正则化,得到每两个分句间的相互推荐度。
4.根据权利要求1所述的文本摘要生成方法,其特征在于,所述计算所述多个分句中每两个分句间的语义相似度包括:
对每个分句进行向量化,得到每个分句的嵌入向量表示;
根据每个分句的嵌入向量表示计算每两个分句间的余弦相似度;
将每两个分句间的余弦相似度确定为每两个分句间的语义相似度。
5.根据权利要求1所述的文本摘要生成方法,其特征在于,采用下述公式对每两个分句间的相互推荐度、每两个分句间的语义相似度以及每两个分句间的位置相似度进行融合处理,得到图邻接矩阵:
matadjc =(αmatt+βmats) ⊙mato
其中,matadjc表示所述图邻接矩阵,matt表示每两个分句间的相互推荐度,mats表示每两个分句间的语义相似度,mato表示每两个分句间的位置相似度,α表示所述相互推荐度的权重,β表示所述语义相似度的权重,α0,β0,且α+β=1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110679639.7/1.html,转载请声明来源钻瓜专利网。





