[发明专利]一种数据处理方法、装置和用于数据处理的装置在审
申请号: | 201910696231.3 | 申请日: | 2019-07-30 |
公开(公告)号: | CN112306252A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 臧娇娇 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 郑傲日 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 用于 | ||
本发明实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:确定上文对应的泛化处理结果;依据所述泛化处理结果、以及多元关系数据,确定所述上文对应的第一联想候选;其中,所述多元关系数据包括:至少两个元素之间的关系,所述至少两个元素中的至少一者经过泛化处理;输出所述第一联想候选。本发明实施例可以提高第一联想候选的命中率。
技术领域
本发明涉及输入技术领域,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
背景技术
设备作为计算机系统与用户或其他设备通信的桥梁,是用户和计算机系统之间进行信息交互的主要装置之一,其可以方便用户在多种场景中输入信息。例如,用户可以在搜索引擎中输入关键词以搜索网页,也可以在即时通讯APP(应用程序,Application)中输入文字以与其他用户进行交流,还可以在文档APP中输入文字以编辑文档等等。
输入法联想功能是输入法程序的一种扩展功能,它的出现减少了用户主动输入的次数、按键的次数,并增加了输入法的智能性。该输入法的实现过程是首先获取用户输入的上文,并根据该上文查询系统二元词库等预设词库来获取联想候选。例如,若上文为“信春哥”,则联想候选可以为“得永生”。例如,若上文为“非洲人来北京避暑”,则联想候选可以为“结果中暑了”。
二元库可用于记录两个元素之间的二元关系,元素可以包括:词汇或者词组或者短句等。目前的二元库可以依据语料训练得到,在实际应用中,语料分布不均等因素、容易导致二元库的覆盖率和命中率较低,进而使得联想候选的命中率较低。例如,若二元库中记录有“信春哥”与“得永生”之间的二元关系1,则在上文1为“信赫哥”的情况下,该上文1将无法命中二元关系1,进而无法得到对应的联想候选。又如,若二元库中记录有“非洲人来北京避暑”与“结果中暑了”之间的二元关系2,则在上文2为“非洲人来西安避暑”的情况下,该上文2将无法命中二元关系2,进而无法得到对应的联想候选。
发明内容
本发明实施例提供一种数据处理方法、装置和用于数据处理的装置,可以提高第一联想候选的命中率。
为了解决上述问题,本发明实施例公开了一种数据处理方法,包括:
确定上文对应的泛化处理结果;
依据所述泛化处理结果、以及多元关系数据,确定所述上文对应的第一联想候选;其中,所述多元关系数据包括:至少两个元素之间的关系,所述至少两个元素中的至少一者经过泛化处理;
输出所述第一联想候选。
另一方面,本发明实施例公开了一种数据处理装置,包括:
泛化处理结果确定模块,用于确定上文对应的泛化处理结果;
第一联想候选确定模块,用于依据所述泛化处理结果、以及多元关系数据,确定所述上文对应的第一联想候选;其中,所述多元关系数据包括:至少两个元素之间的关系,所述至少两个元素中的至少一者经过泛化处理;以及
第一联想候选输出模块,用于输出所述第一联想候选。
再一方面,本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定上文对应的泛化处理结果;
依据所述泛化处理结果、以及多元关系数据,确定所述上文对应的第一联想候选;其中,所述多元关系数据包括:至少两个元素之间的关系,所述至少两个元素中的至少一者经过泛化处理;
输出所述第一联想候选。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910696231.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微型盘式电机智能排布盒
- 下一篇:一种用于浅表性创面及皮肤护理的喷剂敷料