[发明专利]一种兼顾文本长度和相似度的文本纠错方法及系统在审
申请号: | 202210015750.0 | 申请日: | 2022-01-07 |
公开(公告)号: | CN114386404A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 刘学谦;汪玉珠;田贺锁 | 申请(专利权)人: | 北京方寸无忧科技发展有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 陈超 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种兼顾文本长度和相似度的文本纠错方法及系统,通过在相关数据库中进行搜索,获取与待纠错单元最接近的长词,若长词长度处于预设长度区间,创建滑动窗口,用窗口截取文本块,并求得文本块和长词间的编辑距离,得出错误类型,以此对文本进行纠错。若长词长度大于预设长度区间,则判断相似度是否超出预设阈值,再通过文本对比算法,得出错误类型,并进行纠错。对硬件没有特殊要求,且具有非常好的系统兼容性,纠错效率高,大大缩短校对时间。可以实时、快速、便捷的添加新词来满足新词的纠错,通过设置不同领域的数据库,满足不同领域的长词纠错,且不依赖深度学习技术。 | ||
搜索关键词: | 一种 兼顾 文本 长度 相似 纠错 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京方寸无忧科技发展有限公司,未经北京方寸无忧科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210015750.0/,转载请声明来源钻瓜专利网。