[发明专利]一种文本匹配方法、装置、系统以及存储介质在审
申请号: | 202211476656.1 | 申请日: | 2022-11-23 |
公开(公告)号: | CN115712713A | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 蔡晓东;董丽芳 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06N20/00 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 王澎 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 匹配 方法 装置 系统 以及 存储 介质 | ||
本发明提供一种文本匹配方法、装置、系统以及存储介质,属于语言处理领域,方法包括:对原始句子对进行标注分析得到标注句子对;利用编码器对各个标注句子对进行编码得到句子对隐藏向量;根据各个原始句子对以及句子对隐藏向量进行向量分析得到差异向量、第一初始全局向量以及第二初始全局向量;根据差异向量、第一初始全局向量以及第二初始全局向量进行句子对相似性匹配分数的计算得到文本匹配结果。本发明突出了关键字这一重要匹配粒度在句子匹配中的重要性,实现了更精确的文本匹配,相对现有技术,能够更精确地判断文本的相似性且提升了文本匹配的准确率。
技术领域
本发明主要涉及语言处理技术领域,具体涉及一种文本匹配方法、装置、系统以及存储介质。
背景技术
文本匹配是自然语言处理中的一项重要且富有挑战的任务,用于判断两段文本的相似性,广泛应用于搜索引擎、推荐系统、问答系统等场景。在现有的先进文本匹配模型中,大多数方法是对每个单词进行统一处理,直接进行文本比较。但是,这样忽略了文本的匹配粒度,从而降低了匹配的准确率。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种文本匹配方法、装置、系统以及存储介质。
本发明解决上述技术问题的技术方案如下:一种文本匹配方法,包括如下步骤:
导入多个原始句子对,并分别对各个所述原始句子对进行标注分析,得到各个所述原始句子对的标注句子对;
构建编码器,利用所述编码器分别对各个所述原始句子对的标注句子对进行编码,得到各个所述原始句子对的句子对隐藏向量;
分别根据各个所述原始句子对以及所述原始句子对的句子对隐藏向量进行向量分析,得到各个所述原始句子对的差异向量、第一初始全局向量以及第二初始全局向量;
分别根据各个所述原始句子对的差异向量、第一初始全局向量以及第二初始全局向量进行句子对相似性匹配分数的计算,得到各个所述原始句子对的句子对相似性匹配分数,并将所有所述句子对相似性匹配分数作为文本匹配结果。
本发明解决上述技术问题的另一技术方案如下:一种文本匹配装置,包括:
标注分析模块,用于导入多个原始句子对,并分别对各个所述原始句子对进行标注分析,得到各个所述原始句子对的标注句子对;
编码分析模块,用于构建编码器,利用所述编码器分别对各个所述原始句子对的标注句子对进行编码,得到各个所述原始句子对的句子对隐藏向量;
向量分析模块,用于分别根据各个所述原始句子对以及所述原始句子对的句子对隐藏向量进行向量分析,得到各个所述原始句子对的差异向量、第一初始全局向量以及第二初始全局向量;
匹配结果获得模块,用于分别根据各个所述原始句子对的差异向量、第一初始全局向量以及第二初始全局向量进行句子对相似性匹配分数的计算,得到各个所述原始句子对的句子对相似性匹配分数,并将所有所述句子对相似性匹配分数作为文本匹配结果。
基于上述一种文本匹配方法,本发明还提供一种文本匹配系统。
本发明解决上述技术问题的另一技术方案如下:一种文本匹配系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的文本匹配方法。
基于上述一种文本匹配方法,本发明还提供一种计算机可读存储介质。
本发明解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的文本匹配方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211476656.1/2.html,转载请声明来源钻瓜专利网。