[发明专利]基于人工智能的字符串处理方法及相关设备有效
| 申请号: | 202010610790.0 | 申请日: | 2020-06-29 |
| 公开(公告)号: | CN111797594B | 公开(公告)日: | 2023-02-07 |
| 发明(设计)人: | 董润华;徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
| 主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/253;G06F16/903 |
| 代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 陈敬华;孙芬 |
| 地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 字符串 处理 方法 相关 设备 | ||
本申请涉及人工智能技术领域,提供一种基于人工智能的字符串处理方法,所述方法包括:接收输入的多个因子;从区块链中获取与所述多个因子匹配的多个字符串;从所述多个字符串的多个子串中,将所述多个字符串均包含的子串确定为公共子串;通过开发语言确定所述多个字符串中的非公共子串的字符所属的字符类型;将所述非公共子串所属的字符类型映射成与所述字符类型匹配的规则字符串;将所述公共子串与所述规则字符串进行拼接,以构建正则表达式。本发明可应用于智慧政务场景中,从而推动智慧城市的建设。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的字符串处理方法及相关设备。
背景技术
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑,既使用“规律字符串”提取因子。
然而,传统的正则表达式都是人为根据文本数据预定义的。这种方式,由于文本数据的缺乏、格式多变,需要经常根据业务需求人为的去重新定义或者更新正则表达式,效率及其低下。
因此,如何智能地生成符合要求的正则表达式是一个亟待解决的技术问题。
发明内容
鉴于以上内容,有必要提供一种基于人工智能的字符串处理方法及相关设备,能够智能地生成符合要求的正则表达式。
本发明的第一方面提供一种基于人工智能的字符串处理方法,所述基于人工智能的字符串处理方法包括:
接收输入的多个因子,其中,所述因子为需要从文本中提取的字段;
从区块链中获取与所述多个因子匹配的多个字符串,其中,每个所述字符串包括多个子串;
从所述多个字符串的多个子串中,将所述多个字符串均包含的子串确定为公共子串;
通过开发语言确定所述多个字符串中的非公共子串的字符所属的字符类型,其中,所述非公共子串为所述多个子串中不同于所述公共子串的子串;
将所述非公共子串所属的字符类型映射成与所述字符类型匹配的规则字符串;
将所述公共子串与所述规则字符串进行拼接,以构建正则表达式。
在一种可能的实现方式中,所述通过开发语言确定所述多个字符串中的非公共子串的字符所属的字符类型包括:
根据所述公共子串,从每个所述字符串中获得非公共子串;
按照位置先后顺序,依次通过开发语言判断所有所述非公共子串在每个位置的字符的字符类型;
将所有位置的字符类型进行组合,获得所有所述非公共子串的字符所属的的字符类型。
在一种可能的实现方式中,所述将所述非公共子串所属的字符类型映射成与所述字符类型匹配的规则字符串包括:
获取所述非公共子串在每个位置的字符类型对应的字符标识;
针对每个位置的所述字符标识,根据正则语法映射关系,将所述字符标识进行映射,获得每个位置的规则字符;
将所有位置的规则字符进行组合,获得规则字符串。
在一种可能的实现方式中,所述将所述公共子串与所述规则字符串进行拼接,以构建正则表达式包括:
获取所述公共子串在所述多个字符串中的第一位置;
获取所述规则字符串对应的非公共子串在所述多个字符串中的第二位置;
将所述公共子串与所述规则字符串按照所述第一位置和所述第二位置的衔接关系进行拼接,获得正则表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010610790.0/2.html,转载请声明来源钻瓜专利网。





