[发明专利]通过二进制特征值匹配以查询文字的方法无效

专利信息
申请号: 201110065300.4 申请日: 2011-03-17
公开(公告)号: CN102682033A 公开(公告)日: 2012-09-19
发明(设计)人: 张华恩 申请(专利权)人: 环达电脑(上海)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 200436 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 通过 二进制 特征值 匹配 查询 文字 方法
【说明书】:

【技术领域】

本发明涉及一种文字搜索方法,特别是一种通过二进制特征值匹配以查询文字的方法。

【背景技术】

现有的文字搜索方法通常采用字符串比较,以取得搜索结果。例如,中国大陆专利申请第98103003.3号专利揭露一种根据一查询检索数据库的方法,其包括如下步骤:(a)提供一数据库字符串;(b)提供一查询字符串;(c)识别既存在于所述查询字符串又存在于所述数据库字符串中的多图形;(d)提供每一所述识别的多图形的花费;(e)将查询字符串相对于每一数据库字符串定位;(f)将存在于查询字符串和每一个数据库字符串中的多图形匹配,比较的花费提供所述查询字符串和每一所述数据库字符串之间的数值指示的相似性;(g)重新准直所述的查询字符串以减少花费,这通过检查存在于匹配方案中的边界来实现;(h)重复所述的匹配和上述重新准直至一预定的次数或直到匹配花费不再增加;以及(i)对每一个数据库字符串重复上述步骤(c)至(h),以识别那些与上述查询字符串最相似的数据库字符串。

但是,字符串比较的速度比较慢,若在一个庞大的数据库中查询字符串往往需要用户等待较长的时间,无法实现快速搜索。

【发明内容】

本发明的主要目的在于提供一种缩短搜索时间的通过二进制特征值匹配以查询文字的方法。

本发明提供一种通过二进制特征值匹配以查询文字的方法,其用于在一数据库内查询文字,其中,所述数据库内存储有字符组合,且所述方法包括以下步骤:

(1)将数据库内的字符分成X个单元,其中各单元内的字符总频率均衡;

(2)将X个单元分别与X位二进制码的位数相对应;

(3)将数据库内的字符组合分别转换成X位二进制码的对比特征值;

(4)接收查询文字,并将查询文字转换成X位二进制码的查询特征值;

(5)将查询特征值与对比特征值逐一比较,取得匹配的对比特征值。

特别地,所述X为128。

特别地,其中各单元内的字符总频率均衡的步骤具体为;

(1-1)统计数据库内字符的个数为N个;

(1-2)统计数据库内所有字符出现的总频率为M次,并将W定义为单元均衡数,其中,W=M/X,各单元内的字符总频率位于W的误差范围内。

特别地,所述步骤(1-2)之后还包括,

(1-3)统计数据库内各字符分别出现的频率,将单个字符频率定义成Fn,并按频率高低顺序排列,频率最高为F1,频率最低为FK;

(1-4)由F1+……Fn-1<W<F1+……Fn确定n大小并得到临界值P=F1+……Fn-1;

(1-5)将P分别与Fn……FK中任一值相加以得到当前单元内的字符总频率,选择最适频率Fm以使当前单元内的字符总频率与W最接近,其中,m为n……K中其一数值;

(1-6)确定当前单元内的字符为F1……Fn-1、Fm所对应的字符并将其余K-n个字符定义为未分组字符。

(1-7)判断K-n是否等于0;

(1-8)若K-n不等于0,则将K=K-n,并返回至步骤(1-3)。

特别地,若K-n等于0,执行步骤(2)。

特别地,步骤(5)匹配的对比特征值为多条,匹配的对比特征值对应匹配的字符组合。

特别地,步骤(5)之后还包括步骤(6)将查询文字与匹配的字符组合进行字符串比较,以取得精确的查询结果。

与现有技术相比较,本发明利用查询特征值与对比特征值逐一比较,二进制特征值比较的速度快,以便于快速搜索。

【附图说明】

图1为通过二进制特征值匹配以查询文字的方法的流程图。

图2为图1中步骤10的具体流程图。

【具体实施方式】

请参阅图1所示,本发明提供一种通过二进制特征值匹配以查询文字的方法,其用于在一数据库内查询文字,其中,所述数据库内存储有字符组合,且所述方法包括以下步骤:

步骤10:将数据库内的字符分成X个单元,其中各单元内的字符总频率均衡;于本实施例中,所述X为128。

步骤20:将X个单元分别与X位二进制码的位数相对应;

步骤30:将数据库内的字符组合分别转换成X位二进制码的对比特征值;其中,字符组合中包括多个不同单元的字符时,对比特征值中相对应的位上分别置1;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于环达电脑(上海)有限公司,未经环达电脑(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110065300.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top