[发明专利]一种输入纠错方法和装置在审
申请号: | 201810339438.0 | 申请日: | 2018-04-16 |
公开(公告)号: | CN110389666A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 姚波怀;张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭化雨;王宝筠 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 纠错 编码串 纠错规则 输入位置 传统方式 纠错结果 输入纠错 方法和装置 输入编码 通用规则 序列输入 序列训练 预先设置 全面性 调用 舍弃 输出 申请 学习 | ||
本申请实施例公开了一种输入纠错方法,所述方法包括:获取编码串以及输入所述编码串的输入位置序列;将所述输入位置序列输入纠错模型,所述纠错模型为根据历史输入位置序列训练得到的;若判断所述编码串中具有错误输入编码,所述纠错模型输出针对所述编码串的纠错结果;根据所述纠错结果针对所述编码串进行纠错。可见,由于纠错模型中的纠错规则是根据历史输入位置序列进行训练、学习得到的,避免了传统方式中人为预先设置纠错规则、且通用规则生硬问题,能够高效的对编码串进行纠错,针对复杂纠错情况时,不需要如传统方式中调用大量的纠错规则或为了节省纠错时间舍弃部分纠错规则,不仅减少了纠错时间,而且能够提高纠错准确性和全面性。
技术领域
本申请涉及输入法领域,特别是涉及一种输入纠错方法和装置。
背景技术
用户在使用输入法时,经常会出现输错编码串的情况,例如拼音输入法下输错拼音串。编码串会有多种输错的可能,例如输入键盘较小点击偏移导致的错输其他编码,例如快速输入导致编码前后顺序颠倒等。输入法可以针对用户的输错行为进行相应的纠错,纠错的依据一般是人为设定的规则,针对不同的输错可能设置各种纠错规则。
然而,当针对较为复杂的纠错情况时,例如用户所输入的编码串中具有多种输错可能或者多个输错编码时,由于人为设置的纠错规则一般较多且繁杂,导致针对多种输错可能或多个输错编码纠错时,需要调用大量的纠错规则进行纠错。这样进行纠错要么导致纠错时间过长,要么为了节约纠错时间舍弃部分纠错规则导致纠错结果不准确或不全。
可见,通过人为设置的纠错规则进行纠错,针对较为复杂的纠错情况时,对用户造成了不好的纠错体验。
发明内容
为了解决上述技术问题,本申请提供了一种输入纠错方法和装置,能够主动学习规则,去除了人为设置规则的影响,提高纠错准确性和全面性。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种输入纠错方法,所述方法包括:
获取编码串以及输入所述编码串的输入位置序列;
将所述输入位置序列输入纠错模型,所述纠错模型为根据历史输入位置序列训练得到的;
若判断所述编码串中具有错误输入编码,所述纠错模型输出针对所述编码串的纠错结果;
根据所述纠错结果针对所述编码串进行纠错。
可选的,所述历史输入位置序列包括历史数据中正确输入编码串对应的输入位置序列和错误输入编码串对应的输入位置序列;
其中,所述错误输入编码串为历史输入编码串中与对应历史上屏字符不匹配的编码串。
可选的,所述输入位置序列包括所述编码串中的各个编码被输入时的输入位置信息;所述输入位置信息包括屏幕区域信息或者按键信息。
可选的,所述屏幕区域信息包括屏幕区域位置信息或者屏幕区域图片信息;所述屏幕区域为用户在屏幕上点击编码时所点击的区域;其中,所述屏幕区域位置信息包括所述屏幕区域中的所有像素坐标或者所述屏幕区域的中心位置坐标。
可选的,所述按键信息包括用户在实体键盘中输入编码时所点击的按键。
可选的,所述纠错模型为根据以下方式中任意一种或多种的组合训练得到的:
第一种方式为:
所述纠错模型为根据同一输入场景下的历史输入位置序列训练得到的;在所述将所述输入位置序列输入纠错模型之前,还包括:
获取所述编码串对应的目标输入场景;
所述将所述输入位置序列输入纠错模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810339438.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种商标设计用具有发光功能的电脑键盘
- 下一篇:一种输入方法及装置