[发明专利]场景化文字输入的方法及系统、终端以及计算机可读存储介质有效
申请号: | 201810124920.2 | 申请日: | 2018-02-07 |
公开(公告)号: | CN108319377B | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 马鸣;秦添;孟可丰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06N99/00 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王珺;徐瑞红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选词 文字输入 场景化 计算机可读存储介质 词频 按键信息 场景信息 输入信息 特征向量 场景 高维 排序 终端 接收用户 用户输出 输入相 契合 | ||
本发明提出一种场景化文字输入的方法及系统、终端以及计算机可读存储介质。该场景化文字输入的方法包括:接收用户当前输入的按键信息,根据所述按键信息组合成多个候选词;获取用户当前的场景信息和历史的输入信息,并将当前的场景信息和历史的输入信息汇总成高维度特征向量;根据高维度特征向量,确定各个所述候选词在当前场景中的词频;以及按照词频的高低,向用户输出所述候选词的排序。通过本发明的场景化文字输入的方法,能够根据用户所处的场景来确定候选词,使候选词排序与用户在该场景的输入相契合。
技术领域
本发明涉及通信技术领域,尤其涉及一种场景化文字输入的方法及系统、终端以及计算机可读存储介质。
背景技术
随着输入法技术的不断提升,用户对输入准确性的要求也越来越高,普通的输入法词库已经无法满足用户在不同输入场景下的需求。同一串输入码,用户在不同的场景下输入时,所期望得到的候选词也不相同。举例来说,当用户输入“dama”这串输入码的时候,在新闻类的场景下,可能更期望出现“大妈”作为候选词;而在购物类的场景下,则“大码”则更符合预期。
因此,如何能够根据用户所处的场景来确定候选词,使候选词排序与用户所在场景相契合,是大家十分关注的问题。
发明内容
本发明实施例提供一种场景化文字输入的方法、系统和终端,以解决现有技术中的以上的一个或多个技术问题,或至少提供一种有益的选择。
第一方面,本发明实施例提供了一种场景化文字输入的方法,所述方法包括:
接收用户当前输入的按键信息,根据所述按键信息组合成多个候选词;
获取用户当前的场景信息和历史的输入信息,并将当前的所述场景信息和历史的所述输入信息汇总成高维度特征向量;
根据高维度特征向量,确定各个所述候选词在当前场景中的词频;以及
按照词频的高低,向用户输出所述候选词的排序。
优选地或可选地,所述按键信息包括用户输入的按键序列,以及按键时间、按键坐标、按键压力和触摸面积中的至少一种。
结合第一方面,本发明在第一方面的第一种实施方式中,所述方法还包括:
所述根据所述按键信息组合成多个候选词,包括:
根据所述按键序列,组合生成多个初选词;以及
根据所述按键时间和/或所述按键坐标和/或所述按键压力和/或所述触摸面积,对所述初选词进行筛选,经筛选后生成所述候选词。
结合第一方面、第一方面的第一种实施方式,本发明在第一方面的第二种实施方式中,所述将所述场景信息和所述历史信息汇总成高维度特征向量,包括:
根据用户历史的所述输入信息,通过机器学习,生成第一初始特征向量;
根据用户当前的所述场景信息,通过机器学习,生成第二初始特征向量;以及
将所述第一初始特征向量和所述第二初始特征向量进行加权,生成所述高维度特征向量;
其中,所述场景信息包括用户的终端信息、位置信息和操作信息中的至少一种;所述输入信息包括用户的特征信息、行为信息和意图信息中的至少一种。
结合第一方面、第一方面的第一种实施方式和第一方面的第二种实施方式,本发明在第一方面的第三种实施方式中,服务器中存储有候选词的向量区间与词频的映射表;
所述根据高维度特征向量,确定各个所述候选词在当前场景中的词频包括:
根据所述高维度特征向量,计算出各个所述候选词对应的向量区间;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810124920.2/2.html,转载请声明来源钻瓜专利网。