[发明专利]通过二进制特征值匹配以查询文字的方法无效

专利信息
申请号: 201110065300.4 申请日: 2011-03-17
公开(公告)号: CN102682033A 公开(公告)日: 2012-09-19
发明(设计)人: 张华恩 申请(专利权)人: 环达电脑(上海)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 200436 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 通过 二进制 特征值 匹配 查询 文字 方法
【权利要求书】:

1.一种通过二进制特征值匹配以查询文字的方法,其用于在一数据库内查询文字,其中,所述数据库内存储有字符组合,其特征在于所述方法包括以下步骤:

(1)将数据库内的字符分成X个单元,其中各单元内的字符总频率均衡;

(2)将X个单元分别与X位二进制码的位数相对应;

(3)将数据库内的字符组合分别转换成X位二进制码的对比特征值;

(4)接收查询文字,并将查询文字转换成X位二进制码的查询特征值;

(5)将查询特征值与对比特征值逐一比较,取得匹配的对比特征值。

2.根据权利要求1所述的通过二进制特征值匹配以查询文字的方法,其特征在于:所述X为128。

3.根据权利要求2所述的通过二进制特征值匹配以查询文字的方法,其特征在于:其中各单元内的字符总频率均衡的步骤具体为;

(1-1)统计数据库内字符的个数为N个;

(1-2)统计数据库内所有字符出现的总频率为M次,并将W定义为单元均衡数,其中,W=M/X,各单元内的字符总频率位于W的误差范围内。

4.根据权利要求3所述的通过二进制特征值匹配以查询文字的方法,其特征在于:所述步骤(1-2)之后还包括,

(1-3)统计数据库内各字符分别出现的频率,将单个字符频率定义成Fn,并按频率高低顺序排列,频率最高为F1,频率最低为FK;

(1-4)由F1+……Fn-1<W<F1+……Fn确定n大小并得到临界值P=F1+……Fn-1;

(1-5)将P分别与Fn……FK中任一值相加以得到当前单元内的字符总频率,选择最适频率Fm以使当前单元内的字符总频率与W最接近,其中,m为n……K中其一数值;

(1-6)确定当前单元内的字符为F1……Fn-1、Fm所对应的字符并将其余K-n个字符定义为未分组字符。

(1-7)判断K-n是否等于0;

(1-8)若K-n不等于0,则将K=K-n,并返回至步骤(1-3)。

5.根据权利要求4所述的通过二进制特征值匹配以查询文字的方法,其特征在于:若K-n等于0,执行步骤(2)。

6.根据权利要求5所述的通过二进制特征值匹配以查询文字的方法,其特征在于:步骤(5)匹配的对比特征值为多条,匹配的对比特征值对应匹配的字符组合。

7.根据权利要求6所述的通过二进制特征值匹配以查询文字的方法,其特征在于:步骤(5)之后还包括步骤(6)将查询文字与匹配的字符组合进行字符串比较,以取得精确的查询结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于环达电脑(上海)有限公司,未经环达电脑(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110065300.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top