[发明专利]生成候选词的方法及装置在审
| 申请号: | 201911298337.4 | 申请日: | 2019-12-17 |
| 公开(公告)号: | CN112987941A | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 刘世军 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 北京华圣典睿知识产权代理有限公司 11510 | 代理人: | 赵景平 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 生成 候选 方法 装置 | ||
本发明公开了一种生成候选词的方法及装置,该方法包括:实时接收用户输入的当前输入串;查找词库中是否有与当前输入串对应的候选词;如果有,则将候选词作为第一候选词进行展现;如果没有,则对当前输入串进行切分,得到各子串;从词库中获取与各子串对应的各候选词及其属性;分别从各子串对应的候选词中选取一个候选词组成目标词组;将目标词组作为第一候选词进行展现。本发明实施例提供的方案,在生成候选词的过程中,先查找词库中的词语,而当词库中不存在候选词时,考虑将当前输入串拆分为多个子串并组成目标词语,并且还考虑了各个子串的属性,这样能够有效提高生成用户期望的候选词的准确性,有利于提高用户输入效率。
技术领域
本发明涉及输入法技术领域,具体涉及一种生成候选词的方法及装置。
背景技术
输入法是一种将各种符号输入计算机或其他设备的编码方法,是人类和计算机打交道不可或缺的工具。对于中文输入,拼音输入法是人们最常用的输入法之一。对于输入法系统而言,通常会将一些常用词收录在词库中,输入法系统根据用户输入的拼音串,首先会查找词库,如果查不到,则进行一元组词。所述一元组词是指对接收的拼音串进行切分,然后选择切分得到的每个子串对应的词频最高的词进行组词。比如,用户输入的拼音串为“zhoukoudianyizhi”(周口店遗址),但查找词库未得到相应的词,在这种情况下,输入法系统对拼音串“zhoukoudianyizhi”进行拆分,得到两个子串,分别为“zhoukoudian”和“yizhi”,由于这两个子串对应的词频最高的词分别为“周口店”和“一直”,因此生成“周口店一直”这个候选词。再比如,用户输入拼音串“dengdaichaoshi”(等待超时),输入法系统会生成候选词“等待超市”。显然,这样的候选词并不是用户真正想要的候选词,不仅影响用户输入效率,还会影响用户输入体验。
发明内容
本发明实施例提供一种生成候选词的方法及装置,以提高用户输入效率,提高用户输入体验。
为此,本发明提供如下技术方案:
一种生成候选词的方法,所述方法包括:
实时接收用户输入的当前输入串;
查找词库中是否有与所述当前输入串对应的候选词,所述词库中的各词具有属性标记;
如果有,则将所述候选词作为第一候选词进行展现;
如果没有,则对所述当前输入串进行切分,得到各子串;
从所述词库中获取与各子串对应的各候选词及其属性;
分别从各子串对应的候选词中选取一个候选词组成目标词组,所述目标词组中的候选词的属性相关;
将所述目标词组作为第一候选词进行展现。
可选地,所述分别从各子串对应的候选词中选取一个候选词组成目标词组包括:
按照各子串在所述当前输入串中的先后顺序,根据在先子串对应的候选词的属性依次从在后子串对应的候选词中选取一个候选词组成目标词语。
可选地,所述根据在先子串对应的候选词的属性依次从在后子串对应的候选词中选取一个候选词组成目标词语包括:
依次判断在后子串对应的候选词中是否有与在先子串对应的候选词的属性相关的候选词;
如果有,则从在后子串对应的候选词中选取属性相关的候选词组成目标词语;
如果没有,则从在后子串对应的候选词中选取词频最高的候选词组成目标词语。
可选地,在所述查找词库中是否有与所述当前输入串对应的候选词之前,还包括:
获取已上屏词语的属性;
根据所述已上屏词语的属性,对所述当前输入串对应的各候选词进行词频调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911298337.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种商业制冷用换热器
- 下一篇:玻璃鉴定元件、玻璃鉴定器及玻璃鉴定方法





