[发明专利]文本匹配处理方法及装置有效

专利信息
申请号: 201811241976.2 申请日: 2018-10-24
公开(公告)号: CN109614463B 公开(公告)日: 2023-02-03
发明(设计)人: 杨明晖 申请(专利权)人: 创新先进技术有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/284
代理公司: 北京永新同创知识产权代理有限公司 11376 代理人: 林锦辉
地址: 英属开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 匹配 处理 方法 装置
【说明书】:

本公开提供文本匹配处理方法及装置。在该方法中,使用至少一个文本匹配规则模板来对待处理文本进行模板匹配;以及输出经过模板匹配后的匹配结果,该文本匹配规则模板包括至少一行白名单和至少一行黑名单,所述白名单表示文本匹配规则需要包含的至少一个短语,所述黑名单表示文本匹配规则不能包含的至少一个短语,在进行模板匹配时,待处理文本被配置为与文本匹配规则模板中的各个短语进行匹配,文本匹配规则模板中的各行名单之间的匹配逻辑关系为与关系,以及文本匹配规则模板中的每行名单中的各个短语之间的匹配逻辑关系为或关系。利用该方法,使得文本匹配处理更加容易、直观和高效,并且对于业务运营人员而言具有较高的友好度。

技术领域

本公开通常涉及自然语言处理领域,更具体地,涉及文本匹配处理方法及装置。

背景技术

自然语言处理系统一般由文本规则和算法模型组成。文本规则通常比较具体、可控性和可解释性较强,而算法模型通常比较抽象,具有更好的泛化能力。在处理简单的文本处理问题时,仅仅使用文本规则或者仅仅使用算法模型就可以取得不错的结果,而在处理复杂的文本处理问题时,需要将文本规则和算法模型结合使用才能发挥更好的效果。

智能客服机器人是一种自然语言处理系统,其利用文本交互的形式,识别用户提问,解决用户问题。在智能客服机器人中存在多个重要的处理模型,其中,影响最大的处理模块是业务分类模块。业务分类模块被使用来识别用户所提的问题所属的业务类目,然后下游的其它处理模块(比如,算法模型和数据分析模块)利用业务分类模块的业务分类结果来执行相应的处理。随着智能客服机器人所支持的业务发展迅速,业务类目变化频繁,而算法模型的迭代周期较长,难以跟上变化,从而针对该类文本处理问题,通常采用文本规则来处理。

在现有的文本规则实现方案中,最常用的是正则表达式。然而,编写正则表达式需要具有一定的技术知识储备,从而对于缺少技术能力的业务运营人员而言,编写正则表达式并不容易。此外,正则表达式不够直观,容易写错,并且针对复杂的正则表达式,检查和修改也比较困难。

发明内容

鉴于上述问题,本公开提供了一种文本匹配处理方法及装置。利用该文本匹配处理方法及装置,通过提出一种易于编写且直观的文本匹配规则模板,并且利用该文本匹配规则模板来对输入文本进行文本匹配,可以使得文本匹配处理更加容易、直观和高效,并且对于业务运营人员而言具有较高的友好度。

根据本公开的一个方面,提供了一种文本匹配处理方法,包括:使用至少一个文本匹配规则模板来对待处理文本进行模板匹配;以及输出经过模板匹配后的匹配结果,其中,所述文本匹配规则模板包括至少一行白名单和至少一行黑名单,所述白名单表示文本匹配规则需要包含的至少一个短语,所述黑名单表示文本匹配规则不能包含的至少一个短语,在进行模板匹配时,所述待处理文本被配置为与所述文本匹配规则模板中的各个短语进行匹配,所述文本匹配规则模板中的各行名单之间的匹配逻辑关系为与关系,以及所述文本匹配规则模板中的每行名单中的各个短语之间的匹配逻辑关系为或关系。

可选地,在上述方面的一个示例中,所述方法还可以包括:获取所述待处理文本。

可选地,在上述方面的一个示例中,所述方法还可以包括:对所述待处理文本进行预处理,以去除所述待处理文本中的无效字符。

可选地,在上述方面的一个示例中,所述方法还可以包括:使用字典树来对所述待处理文本进行关键词预匹配,以获取所述待处理文本中的与所述字典树匹配的短语,以及使用至少一个文本匹配规则模板来对所述待处理文本进行模板匹配包括:使用至少一个文本匹配规则模板来对所获取的与所述字典树匹配的短语进行模板匹配,其中,所述字典树是基于所有文本匹配规则模板中所包含的经过去重处理后的短语创建的。

可选地,在上述方面的一个示例中,所述方法还可以包括:按照预定规则对经过模板匹配后的匹配结果进行整合处理,以及输出经过模板匹配后的匹配结果包括:输出经过整合处理后的匹配结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811241976.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top