[发明专利]基于人工智能的字符串处理方法及相关设备有效
| 申请号: | 202010610790.0 | 申请日: | 2020-06-29 |
| 公开(公告)号: | CN111797594B | 公开(公告)日: | 2023-02-07 |
| 发明(设计)人: | 董润华;徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
| 主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/253;G06F16/903 |
| 代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 陈敬华;孙芬 |
| 地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 字符串 处理 方法 相关 设备 | ||
1.一种基于人工智能的字符串处理方法,其特征在于,所述基于人工智能的字符串处理方法包括:
接收输入的多个因子,其中,所述因子为需要从文本中提取的字段;
从区块链中获取与所述多个因子匹配的多个字符串,其中,每个所述字符串包括多个子串;
从所述多个字符串的多个子串中,将所述多个字符串均包含的子串确定为公共子串;
通过开发语言确定所述多个字符串中的非公共子串的字符所属的字符类型,其中,所述非公共子串为所述多个子串中不同于所述公共子串的子串;
将所述非公共子串所属的字符类型映射成与所述字符类型匹配的规则字符串,包括:获取所述非公共子串在每个位置的字符类型对应的字符标识,针对每个位置的所述字符标识,根据正则语法映射关系,将所述字符标识进行映射,获得每个位置的规则字符,将所有位置的规则字符进行组合,获得所述规则字符串;
将所述公共子串与所述规则字符串进行拼接,以构建正则表达式。
2.根据权利要求1所述的基于人工智能的字符串处理方法,其特征在于,所述通过开发语言确定所述多个字符串中的非公共子串的字符所属的字符类型包括:
根据所述公共子串,从每个所述字符串中获得非公共子串;
按照位置先后顺序,依次通过开发语言判断所有所述非公共子串在每个位置的字符的字符类型;
将所有位置的字符类型进行组合,获得所有所述非公共子串的字符所属的字符类型。
3.根据权利要求1所述的基于人工智能的字符串处理方法,其特征在于,所述将所述公共子串与所述规则字符串进行拼接,以构建正则表达式包括:
获取所述公共子串在所述多个字符串中的第一位置;
获取所述规则字符串对应的非公共子串在所述多个字符串中的第二位置;
将所述公共子串与所述规则字符串按照所述第一位置和所述第二位置的衔接关系进行拼接,获得正则表达式。
4.根据权利要求1至3中任一项所述的基于人工智能的字符串处理方法,其特征在于,所述基于人工智能的字符串处理方法还包括:
获取多篇测试文档以及多个测试因子;
使用人工定义的预设正则表达式从所述多篇测试文档中提取第一因子;
使用构建的所述正则表达式从所述多篇测试文档中提取第二因子;
从所述第一因子和所述第二因子中,确定所述第一因子和所述第二因子均包含的相同因子;
根据所述相同因子的数量以及所述多个测试因子的数量,计算准确率;
若所述准确率高于预设阈值,确定构建的所述正则表达式符合要求。
5.根据权利要求4所述的基于人工智能的字符串处理方法,其特征在于,所述基于人工智能的字符串处理方法还包括:
若所述准确率低于预设阈值,确定构建的所述正则表达式不符合要求;
对构建的所述正则表达式进行优化。
6.根据权利要求1所述的基于人工智能的字符串处理方法,其特征在于,所述基于人工智能的字符串处理方法还包括:
接收输入的目标文档;
将所述目标文档与所述正则表达式进行匹配,以抽取所述目标文档中的目标因子,其中,所述目标因子的字符类型与所述多个因子的字符类型相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010610790.0/1.html,转载请声明来源钻瓜专利网。





