[发明专利]一种生成词条的方法和装置有效
申请号: | 201210145606.5 | 申请日: | 2012-05-11 |
公开(公告)号: | CN103389800A | 公开(公告)日: | 2013-11-13 |
发明(设计)人: | 王晔晗;戴帅湘;贺文嵩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F3/0487 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 词条 方法 装置 | ||
【技术领域】
本发明涉及输入法技术领域,特别涉及一种生成词条的方法和装置。
【背景技术】
输入法是指为了将各种符号输入计算机或其他设备(如手机)而采用的编码方法。以汉字输入法为例,针对每个汉字或词设定相应的编码并保存于词库中,只要用户输入对应的编码就能输入所需的汉字或词。例如拼音输入法,用户只需键入汉字对应的拼音等编码串即可输入期望的汉字。
现有输入法中获取新词的方法,需要用户在候选框中选择好所需要的文字,然后一次上屏,则将用户上屏的文字学习成一个新词。然而在用户使用键盘输入文字编码等符号的过程中,由于误选等各种原因难免会产生错误输入,使得已上屏的文字不符合预期。此时,需要先把输入的错误文字删除,并重新输入,再在候选框上重新选择,然后一次上屏,再次输入的文字才能被学习成一个新词。比如,用户期望输入“开放集”,在输入拼音编码“kaifangji”后,出现了“1.开放及、2.开放、3.开房、4.开方、5.开”等的候选词,此时,用户可能习惯性地按空格键就选定了“开放及”上屏,导致选词发生错误。在进行修改时,用户则需要先把输入的错误文字“开放及”删除,并重新输入拼音编码“kaifangji”,再在候选框上重新选择“2”在候选词中选定“开放”后,再从候选框的选项“1.及、2集、3.即、4.机、5.级”中选择“2”,上屏为“开放集”,这时候系统将“开放集”学习成一个新词。由此可见,采用这种方法获取新词时,对正确的文字也需要删除后重新输入,该些文字才能被学习成一个新词,导致输入效率低,不符合用户的使用习惯,用户体验差。
【发明内容】
有鉴于此,本发明提供了一种生成词条的方法和装置,从用户的输入行为获取新词,更符合用户的输入习惯,可以提高用户输入的效率,提升用户体验。
具体技术方案如下:
一种生成词条方法,该方法包括:在获取到用户的回退行为后,执行以下流程:
将上一次上屏的字符串作为原字符串,记录本次回退行为回退的字符串对应的编码,并记录除回退的字符串之外剩余的原字符串;
获取用户接续上屏的字符串对应的编码,比较与所述回退的字符串对应的编码是否相符,如果是,则将所述剩余的原字符串与所述接续上屏的字符串进行拼接生成一个词条。
根据本发明一优选实施例,所述获取用户的回退行为,具体包括:
接收用户的输入行为;
对用户的输入行为进行分类识别,将输入退格键或删除键的输入行为识别为回退行为。
根据本发明一优选实施例,在所述接收用户的输入行为之后,还包括:
对用户的输入行为进行预处理,将与输入法无关的按键信息过滤去除,并对剩余的按键信息进行再编码。
根据本发明一优选实施例,所述对用户的输入行为进行分类识别,还包括:
将用户字符串确认输入到屏幕上的输入行为识别为上屏行为;
在将用户的输入行为识别为上屏行为之后,还包括:
记录上屏的字符串和对应的编码。
根据本发明一优选实施例,在所述记录本次回退行为回退的字符串对应的编码时,还包括:记录本次回退行为回退的次数;
在所述获取用户接续上屏的字符串对应的编码之前,还包括:
判断用户接续上屏的字符串的个数与回退的次数之间的关系,
如果用户接续上屏的字符串的个数与回退的次数相等,则继续执行所述获取用户接续上屏的字符串对应的编码的步骤;如果用户接续上屏的字符串的个数大于回退的次数,放弃针对本次回退行为的记录。
根据本发明一优选实施例,在所述用户接续上屏的过程中,累加记录用户接续上屏的字符串,当字符串个数等于回退的次数时,则获取累加的接续上屏的字符串对应的编码,比较与所述回退的字符串对应的编码是否相符。
根据本发明一优选实施例,所述上屏的字符串对应的编码是拼音编码;
所述编码相符包括:
所述接续上屏的字符串对应输入的拼音与所述回退的字符串对应输入的拼音完全相同;或者
所述接续上屏的字符串对应输入的拼音的声母与所述回退的字符串对应输入的拼音的声母相同。
根据本发明一优选实施例,所述上屏的字符串对应的编码是笔划编码;
所述编码相符包括:
所述接续上屏的字符串对应输入的笔划与所述回退的字符串对应输入的笔划完全相同。
根据本发明一优选实施例,在将所述剩余的原字符串与所述接续上屏的字符串进行拼接生成一个词条之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210145606.5/2.html,转载请声明来源钻瓜专利网。