[发明专利]字符串验证方法、字符串扩充方法与验证模型训练方法有效
申请号: | 201611243457.0 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108228682B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 刘昭宏;阙志克;郭志忠;李崇汉;洪健咏 | 申请(专利权)人: | 财团法人工业技术研究院 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/35 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
地址: | 中国台湾新竹*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串 验证 方法 扩充 模型 训练 | ||
1.一种字符串验证方法,其特征在于,包含:
撷取待验名称字符串;
依据该待验名称字符串产生待查询字符串;
对该待查询字符串使用自动语汇推荐功能以取得至少一回传字符串,其中各所述回传字符串分别包括该待查询字符串以及至少一相关字符串;
从该至少一相关字符串中撷取至少一特征数据;以及
依据该至少一特征数据与验证模型判断该待验名称字符串的分类。
2.根据权利要求1所述的方法,其中于撷取该待验名称字符串时,更包含撷取关联于该待验名称字符串的语言或地区,并且于产生该待查询字符串的步骤还依据该语言或该地区产生该待查询字符串。
3.根据权利要求2所述的方法,其中于从该至少一回传字符串中撷取该至少一特征数据的步骤是依据该语言或该地区。
4.根据权利要求1所述的方法,其中于依据该至少一特征数据与该验证模型判断该待验名称字符串的分类步骤中包含:
依据该至少一特征数据计算特征值;以及
依据该特征值与该验证模型,判断该待验名称字符串的分类。
5.根据权利要求4所述的方法,其中于依据该至少一特征数据计算该特征值的步骤中,包含:
依据该验证模型中一分类的多个验证词组,判断该至少一特征数据是否对应所述多个验证词组;以及
依据前述多个判断结果,产生特征向量作为该特征值。
6.根据权利要求4所述的方法,其中该特征值包含该至少一特征数据,且于依据该特征值与该验证模型判断该待验名称字符串的分类的步骤中包含:
从该验证模型中选择第一分类,该第一分类对应于至少一验证词组;以及
判断该至少一特征数据是否对应该至少一验证词组,以判断该待验名称字符串是否属于该第一分类。
7.根据权利要求4所述的方法,其中于依据该至少一特征数据计算该特征值的步骤中,包含以该至少一特征数据产生特征向量,且于依据该特征值与该验证模型,判断该待验名称字符串的分类的步骤中,依据该特征向量与该验证模型以判断该待验名称字符串的分类。
8.根据权利要求1所述的方法,其中于撷取该待验名称字符串的步骤中,还撷取分类,且于判断该待验名称字符串的分类的步骤中为判断该待验名称字符串是否属于该分类。
9.根据权利要求8所述的方法,其中于产生该待查询字符串的步骤中还依据关于该分类的至少一伴随字符串产生该待查询字符串。
10.一种字符串扩充方法,其特征在于,包含:
从字符串库中的多个字符串产生待查询字符串;
对该待查询字符串使用自动语汇推荐功能以取得至少一回传字符串,其中各所述回传字符串分别包括该待查询字符串以及至少一相关字符串;以及
分析该至少一相关字符串以扩充该字符串库。
11.根据权利要求10所述的方法,还包含取得字符串数上限,并且于产生该待查询字符串的步骤中,包含:
从该字符串库的所述多个字符串选择N个第一字符串,其中N为小于等于该字符串数上限的正整数;以及
依据该N个被选择的第一字符串产生该待查询字符串。
12.根据权利要求10所述的方法,其中于分析该至少一回传字符串以扩充该字符串库的步骤中包含:
比对该至少一回传字符串其中之一与该字符串库的所述多个字符串;以及
当所比对的该回传字符串不属于该字符串库的所述多个字符串时,以所比对的该回传字符串扩充该字符串库的所述多个字符串。
13.根据权利要求10所述的方法,其中于撷取所述多个第一字符串时,还撷取关于每一个该第一字符串的地区或语言,且于产生该待查询字符串的步骤中,还依据该地区或该语言产生该待查询字符串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611243457.0/1.html,转载请声明来源钻瓜专利网。