[发明专利]一种英文单词拼写检查方法在审
| 申请号: | 201810555195.4 | 申请日: | 2018-06-01 |
| 公开(公告)号: | CN109033065A | 公开(公告)日: | 2018-12-18 |
| 发明(设计)人: | 邵玉斌;王林坪;龙华;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 单词 编辑距离 单词集合 拼写检查 英文单词 按键编辑距离 输入单词 自然语言处理技术 视觉 加权编辑距离 文本编辑器 阈值筛选 常规的 相似度 冗余 匹配 近似 英文 引入 | ||
1.一种英文单词拼写检查方法,其特征在于:
Step1:选中所需进行拼写检查的单词A;
Step2:遍历英文词典,将单词A与词典中词汇进行近似匹配,利用编辑距离来度量查询,设编辑距离的阈值为X,筛选出部分单词集合B={w1,w2,w3,…,wn},n的大小由阈值X决定,n表示的是单词A与英文词典中所有单词的编辑距离小于X的单词总个数;
Step3:根据键盘字母近似数据库,计算单词A与单词集合B={w1,w2,w3,…,wn}中元素wi,i∈[1,n]之间基于键盘字母近似的编辑距离I(A,Bi);
Step4:根据字母视觉相似数据库,计算单词A与单词集合B={w1,w2,w3,…,wn}中元素wi,i∈[1,n]之间基于字母视觉相似的编辑距离J(A,Bi);
Step5:设Step3、Step4步骤所计算出的编辑距离对应权值分别为i、j,权值i、j满足i+j=1的要求,由编辑距离I(A,B)及权值i、编辑距离J(A,B)及权值j,计算单词A和文本B的加权编辑距离R(A,B)=I(A,B)×i+J(A,B)×j,根据加权编辑距离和阈值Y进一步筛选单词集合B中的元素。
2.根据权利要求1所述的英文单词拼写检查方法,其特征在于:所述步骤Step5中所述的加权编辑距离表示如下:
R(A,B)=I(A,B)×i+J(A,B)×j
其中,R(A,B)表示用B替换A的加权编辑距离,I(A,B)为A到B的基于键盘字母近似的编辑距离,J(A,B)为A到B的基于字母视觉相似的编辑距离,i、j为视觉编辑距离和按键编辑距离的权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810555195.4/1.html,转载请声明来源钻瓜专利网。





