[发明专利]摘要生成方法、装置、设备及存储介质有效
申请号: | 202110972150.9 | 申请日: | 2021-08-24 |
公开(公告)号: | CN113420545B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 张莉 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/284;G06F40/289;G06F16/34 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;杨毅玲 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摘要 生成 方法 装置 设备 存储 介质 | ||
本发明涉及人工智能,提供一种摘要生成方法、装置、设备及存储介质。该方法能够根据摘要生成请求获取待处理文本,对待处理文本中每个文本语句进行分词处理,得到语句分词,根据语句分词的分词向量生成初始语句向量,根据初始语句向量生成初始摘要,根据分词向量及初始摘要生成分词权值,根据分词权值对分词向量进行加权和运算处理,得到目标语句向量,根据目标语句向量生成中间摘要,计算初始摘要与中间摘要的摘要相似度,若摘要相似度大于或者等于预设相似度阈值,将中间摘要确定为待处理文本的目标摘要。本发明能够提高目标摘要的准确性。此外,本发明还涉及区块链技术,所述目标摘要可存储于区块链中。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种摘要生成方法、装置、设备及存储介质。
背景技术
文本摘要生成方式是指通过各种算法,抽取、精炼文本中的要点信息,用以概括原始文本的主要内容或大意。在目前的文本摘要生成方式中,主要基于TextRank算法分析文本中共同出现的词汇以计算句子相似度,再基于Pagerank算法计算句子权重,进而选择权值较高的句子生成摘要,然而,这种方式在计算相似度时容易受到高频词的影响,导致无法生成准确的摘要。
发明内容
鉴于以上内容,有必要提供一种摘要生成方法、装置、设备及存储介质,能够提高目标摘要的生成准确性。
一方面,本发明提出一种摘要生成方法,所述摘要生成方法包括:
当接收到摘要生成请求时,根据所述摘要生成请求获取待处理文本;
对所述待处理文本中每个文本语句进行分词处理,得到每个文本语句的语句分词;
根据所述语句分词的分词向量生成所述文本语句的初始语句向量,并根据所述初始语句向量生成所述待处理文本的初始摘要;
根据所述分词向量及所述初始摘要生成所述语句分词的分词权值;
根据所述分词权值对所述分词向量进行加权和运算处理,得到所述文本语句的目标语句向量;
根据所述目标语句向量生成所述待处理文本的中间摘要;
计算所述初始摘要与所述中间摘要的摘要相似度;
若所述摘要相似度大于或者等于预设相似度阈值,将所述中间摘要确定为所述待处理文本的目标摘要。
根据本发明优选实施例,所述根据所述摘要生成请求获取待处理文本包括:
解析所述摘要生成请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取文本路径及文本标识;
根据所述文本路径及所述文本标识生成查询语句;
执行所述查询语句,得到所述待处理文本。
根据本发明优选实施例,所述对所述待处理文本中每个文本语句进行分词处理,得到每个文本语句的语句分词包括:
对于每个文本语句,基于预设词典对所述文本语句进行切分处理,得到多个切分路径及每个切分路径所对应的路径分词;
获取所述路径分词在所述预设词典的词汇权值;
计算所述词汇权值的总和,得到所述切分路径的切分概率;
将所述切分概率最大的切分路径所对应的路径分词确定为所述语句分词。
根据本发明优选实施例,在获取所述路径分词在所述预设词典的词汇权值之前,所述方法还包括:
获取训练样本,所述训练样本包括训练文本及训练词汇;
统计所述训练词汇在所述训练文本中的词汇数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110972150.9/2.html,转载请声明来源钻瓜专利网。