[发明专利]组词方法和装置、用于组词的装置有效

专利信息
申请号: 201710861480.4 申请日: 2017-09-21
公开(公告)号: CN109542243B 公开(公告)日: 2023-04-18
发明(设计)人: 左艳波 申请(专利权)人: 北京搜狗科技发展有限公司
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100084 北京市海淀区中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 方法 装置 用于
【说明书】:

发明实施例提供了一种组词方法和装置、用于组词的装置,其中的方法具体包括:接收用户的输入串;若所述输入串在预置数据集的命中情况符合预置条件,则根据所述输入串获取符合组合规则的组词路径,作为组词候选;其中,所述预置数据集包括:字集和所述字集对应的编码单元集。本发明实施例可以提高组词的成功率,且可以提高组词候选的合理性和质量,进而可以提高用户的输入效率。

技术领域

本发明涉及计算机信息输入技术领域,特别是涉及一种组词方法和装置、以及一种用于组词的装置。

背景技术

目前,涉及交互的设备,通常需要用户通过输入法程序将自己的操作意图与设备交互识别。例如,用户可以输入输入串,然后由输入法程序依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。

当词库中不存在输入串直接命中的词条时,输入法程序可以触发组词功能。现有的组词过程具体为:查找多元库中的多元关系,该依据该多元关系的命中情况计算每个组词方案中词汇串的路径概率,并将具有最大路径概率的组词方案作为首选项返回给用户。其中,该多元关系是指词汇与词汇之间的搭配关系,如“天气-好热”、“我-知道”、“喜欢-你”、“十万-八千”等可以具有二元关系。组词功能非常重要,组词结果的好坏可以影响输入法程序的质量,也将影响到用户的体验。

在实际应用中,由于数字和单位对应的组合为无限集,故对于包含数字和单位的组词,往往需要非常多的多元关系。然而,一方面,受限于存储空间,存储的多元关系有限;另一方面,多元库中存储的多元关系往往是通过统计学习的方式得到,通常存储的多元关系很难保证能够覆盖所有的情况。这样,在组词过程中若无法命中多元库中的多元关系,将导致组词失败。例如,若多元库中未存储“一亿零八万九千”,则输入串“yiyilingbawanjiuqian”对应的词汇“一亿”、“零”、“八万”、“九千”等将无法命中多元库中的多元关系,进而导致组词失败。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的组词方法、组词装置、用于组词的装置,本发明实施例可以提高组词的成功率,且可以提高组词候选的合理性和质量,进而可以提高用户的输入效率。

为了解决上述问题,本发明实施例公开了一种组词方法,包括:

接收用户的输入串;

若所述输入串在预置数据集的命中情况符合预置条件,则根据所述输入串获取符合组合规则的组词路径,作为组词候选;其中,所述预置数据集包括:字集和所述字集对应的编码单元集。

另一方面,本发明实施例公开了一种组词装置,包括:

输入串接收模块,用于接收用户的输入串;以及

组词候选获取模块,用于若所述输入串在预置数据集的命中情况符合预置条件,则根据所述输入串获取符合组合规则的组词路径,作为组词候选;其中,所述预置数据集包括:字集和所述字集对应的编码单元集。

可选地,所述装置还包括:

判断模块,用于判断所述输入串在预置数据集的命中情况是否符合预置条件:

所述判断模块,包括:

切分子模块,用于对所述输入串进行切分,得到对应的切分结果;

判断子模块,用于判断所述输入串对应的切分结果是否命中所述预置数据集。

可选地,所述组词候选获取模块包括:

查找子模块,用于依据所述切分结果,在编码单元集与字集之间的映射关系中进行查找,以得到与所述切分结果相匹配的单字,作为所述输入串对应的待组单字;

路径确定子模块,用于依据所述输入串对应的待组单字,确定组词路径;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710861480.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top