[发明专利]文本处理方法、装置、电子设备及存储介质在审
申请号: | 202111478093.5 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114238562A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 李向林 | 申请(专利权)人: | 广东明创软件科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/295 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 苗燕 |
地址: | 523860 广东省东莞市长*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 电子设备 存储 介质 | ||
1.一种文本处理方法,其特征在于,所述方法包括:
获取待处理文本,所述待处理文本为与待查询文本匹配度最高的答案文本;
获取所述待处理文本所包括的答案句与所述待查询文本的相关度得分;以及
获取所述待处理文本所包括的答案句对应的实体重要度得分;
基于所述相关度得分和所述实体重要度得分,从所述待处理文本所包括的答案句中确定所述待处理文本的关键答案句。
2.根据权利要求1所述的方法,其特征在于,所述获取所述待处理文本所包括的答案句与所述待查询文本的相关度得分,包括:
按照预设分隔符将所述待处理文本划分为多个答案句;
将所述多个答案句和所述待查询文本输入到文本匹配模型中,获取所述文本匹配模型输出的所述多个答案句与所述待查询文本的相关度得分。
3.根据权利要求2所述的方法,其特征在于,所述获取所述待处理文本所包括的答案句对应的实体重要度得分,包括:
将所述多个答案句输入到实体识别模型中,获取所述实体识别模型输出的所述多个答案句各自对应的命名实体;
获取所述多个答案句中,每个答案句所包括的命名实体各自对应的历史搜索频次;
基于所述历史搜索频次,确定每个答案句所包括的命名实体各自对应的重要度得分;
将每个答案句各自所包括的目标命名实体对应的重要度得分,作为每个答案句各自的实体重要度得分,所述目标命名实体为对应答案句中所包括的命名实体中对应的重要度得分最高的命名实体。
4.根据权利要求3所述的方法,其特征在于,所述获取所述多个答案句中,每个答案句所包括的命名实体各自对应的历史搜索频次,包括:
将所述多个答案句中,每个答案句所包括的命名实体链接到知识图谱中;
获取所述所述多个答案句中,每个答案句所包括的命名实体各自对应的历史搜索频次。
5.根据权利要求1所述的方法,其特征在于,所述基于所述相关度得分和所述实体重要度得分,从所述待处理文本所包括的答案句中确定所述待处理文本的关键答案句,包括:
将所述相关度得分和所述实体重要度得分进行加权融合,计算得到所述待处理文本所包括的答案句各自对应的关键性得分;
基于所述关键性得分,对所述待处理文本所包括的答案句进行排序;
将排序后对应的关键性得分最高的答案句,确定为所述待处理文本的关键答案句。
6.根据权利要求1所述的方法,其特征在于,所述获取待处理文本,包括:
获取待查询文本;
根据所述待查询文本,获取与所述待查询文本匹配度最高的答案文本,将所述与待查询文本匹配度最高的答案文本作为待处理文本。
7.根据权利要求1-6任一所述的方法,其特征在于,所述基于所述相关度得分和所述实体重要度得分,确定所述待处理文本的关键答案句之后还包括:
对所述待处理文本的关键答案句进行高亮显示;以及
为所述关键答案句中的命名实体配置对应的超链接。
8.一种文本处理装置,其特征在于,所述装置包括:
文本获取单元,用于获取待处理文本,所述待处理文本为与待查询文本匹配度最高的答案文本;
第一得分获取单元,用于获取所述待处理文本所包括的答案句与所述待查询文本的相关度得分;以及
第二得分获取单元,用于获取所述待处理文本所包括的答案句对应的实体重要度得分;
确定单元,用于基于所述相关度得分和所述实体重要度得分,从所述待处理文本所包括的答案句中确定所述待处理文本的关键答案句。
9.一种电子设备,其特征在于,包括一个或多个处理器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行权利要求1-7任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东明创软件科技有限公司,未经广东明创软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111478093.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种针对非均匀轨迹序列的预测方法
- 下一篇:标记机构