[发明专利]通过二进制特征值匹配以查询文字的方法无效
| 申请号: | 201110065300.4 | 申请日: | 2011-03-17 |
| 公开(公告)号: | CN102682033A | 公开(公告)日: | 2012-09-19 |
| 发明(设计)人: | 张华恩 | 申请(专利权)人: | 环达电脑(上海)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200436 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通过 二进制 特征值 匹配 查询 文字 方法 | ||
1.一种通过二进制特征值匹配以查询文字的方法,其用于在一数据库内查询文字,其中,所述数据库内存储有字符组合,其特征在于所述方法包括以下步骤:
(1)将数据库内的字符分成X个单元,其中各单元内的字符总频率均衡;
(2)将X个单元分别与X位二进制码的位数相对应;
(3)将数据库内的字符组合分别转换成X位二进制码的对比特征值;
(4)接收查询文字,并将查询文字转换成X位二进制码的查询特征值;
(5)将查询特征值与对比特征值逐一比较,取得匹配的对比特征值。
2.根据权利要求1所述的通过二进制特征值匹配以查询文字的方法,其特征在于:所述X为128。
3.根据权利要求2所述的通过二进制特征值匹配以查询文字的方法,其特征在于:其中各单元内的字符总频率均衡的步骤具体为;
(1-1)统计数据库内字符的个数为N个;
(1-2)统计数据库内所有字符出现的总频率为M次,并将W定义为单元均衡数,其中,W=M/X,各单元内的字符总频率位于W的误差范围内。
4.根据权利要求3所述的通过二进制特征值匹配以查询文字的方法,其特征在于:所述步骤(1-2)之后还包括,
(1-3)统计数据库内各字符分别出现的频率,将单个字符频率定义成Fn,并按频率高低顺序排列,频率最高为F1,频率最低为FK;
(1-4)由F1+……Fn-1<W<F1+……Fn确定n大小并得到临界值P=F1+……Fn-1;
(1-5)将P分别与Fn……FK中任一值相加以得到当前单元内的字符总频率,选择最适频率Fm以使当前单元内的字符总频率与W最接近,其中,m为n……K中其一数值;
(1-6)确定当前单元内的字符为F1……Fn-1、Fm所对应的字符并将其余K-n个字符定义为未分组字符。
(1-7)判断K-n是否等于0;
(1-8)若K-n不等于0,则将K=K-n,并返回至步骤(1-3)。
5.根据权利要求4所述的通过二进制特征值匹配以查询文字的方法,其特征在于:若K-n等于0,执行步骤(2)。
6.根据权利要求5所述的通过二进制特征值匹配以查询文字的方法,其特征在于:步骤(5)匹配的对比特征值为多条,匹配的对比特征值对应匹配的字符组合。
7.根据权利要求6所述的通过二进制特征值匹配以查询文字的方法,其特征在于:步骤(5)之后还包括步骤(6)将查询文字与匹配的字符组合进行字符串比较,以取得精确的查询结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于环达电脑(上海)有限公司,未经环达电脑(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110065300.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种包覆型铜包钢电话引入线
- 下一篇:一种嵌入式多媒体播放系统及方法





