[发明专利]文本处理方法、装置、电子设备和存储介质在审
申请号: | 202111644876.6 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114330365A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 余晓峰;郑博文 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 丰佩印 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种文本处理方法、装置、电子设备和存储介质,涉及数据处理技术领域,尤其涉及深度学习技术领域和语义匹配技术领域,该方法包括:获取待查询的第一文本;对第一文本进行特征处理,得到第一特征向量;将第一特征向量与多个第二特征向量进行对比,确定与第一特征向量匹配的目标特征向量;基于目标特征向量确定与第一文本匹配的查询结果。容易注意到的是,第一特征向量是用户侧的特征,第二特征向量是查询侧的特征向量,本公开可以将查询侧的特征和内容侧的特征同时进行处理,可以进行全局处理,从而解决了难以同时保证语义匹配精度和处理效率的技术问题,进而达到了提高查询结果的精确度。
技术领域
本公开涉及数据处理技术领域,尤其涉及深度学习技术领域和语义匹配技术领域,具体涉及一种文本处理方法、装置、电子设备和存储介质。
背景技术
在NLP(Natural Language Processing,自然语言处理)的诸多应用中,有很多应用都有在语义上衡量文本相似度的需求,我们将这类需求统称为语义匹配,此外,语义匹配的应用范围非常广,例如在搜索、问答系统、电商等。但目前基于如何获得较好的语义匹配效果的技术问题,尚未有解决方案。
发明内容
本公开提供了一种文本处理方法、装置、电子设备和存储介质。
根据本公开的第一方面,提供了一种文本处理方法,包括:获取待查询的第一文本;对第一文本进行特征处理,得到第一特征向量;将第一特征向量与多个第二特征向量进行对比,确定与第一特征向量匹配的目标特征向量,其中,多个第二特征向量通过对目标卡片的至少两组特征向量进行特征交叉计算而得到;基于目标特征向量确定与第一文本匹配的查询结果。
根据本公开的第二方面,提供了一种文本处理装置,包括:获取模块,用于获取待查询的第一文本;特征处理模块,用于对第一文本进行特征处理,得到第一特征向量;对比模块,用于将第一特征向量与多个第二特征向量进行对比,确定与第一特征向量匹配的目标特征向量,其中,多个第二特征向量通过对目标卡片的至少两组特征向量进行特征交叉计算而得到;确定模块,用于基于目标特征向量确定与第一文本匹配的查询结果。
根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提出的文本处理方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提出的文本处理方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行本公开提出的文本处理方法。
在本公开的实施例中,提供了一种可以用于语义匹配的文本处理方法、装置、电子设备和存储介质。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的一种文本处理方法的流程图;
图2是卡片信息在终端的显示界面上的示意图;
图3是根据本公开优选实施例的一种文本处理方法的流程图;
图4是根据本公开实施例的一种文本处理装置的结构示意图;
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111644876.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种集成曲面折叠屏的汽车顶棚结构
- 下一篇:账户创建方法及装置