[发明专利]一种输入配置方法、装置和电子设备在审
| 申请号: | 201810443413.5 | 申请日: | 2018-05-10 |
| 公开(公告)号: | CN110472223A | 公开(公告)日: | 2019-11-19 |
| 发明(设计)人: | 黄海兵;庞帅;刘羽佳 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F3/023 |
| 代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 莎日娜<国际申请>=<国际公布>=<进入 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通用语言模型 候选信息 输入信息 语言模型 匹配 个性化 输入法 个性化需求 电子设备 全网用户 输入配置 输入效率 记录 | ||
本发明实施例提供了一种输入配置方法、装置和电子设备,其中,所述方法包括:输入法获取通用语言模型,记录用户的输入信息,其中,所述通用语言模型依据全网用户的输入信息训练得到;采用所述用户的输入信息对所述通用语言模型进行训练,得到所述用户对应的个性化语言模型;依据所述个性化语言模型匹配候选信息;进而采用个性化语言模型代替通用语言模型匹配候选信息,能够使输入法匹配出更符合用户个性化需求的候选信息,提高了用户输入效率。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种输入配置方法、装置和电子设备。
背景技术
随着输入法技术的发展,使得输入法越来越智能化,即输入法可以更好的理解用户的输入,并为用户联想出更为准确的输出,比如当用户输入:“床前明月光”,输入法能够联想出该诗句的下一句:“疑似地上霜”;进而提高了用户的输入效率,降低了用户输入成本。其中,输入法的智能主要是依赖于各种语言模型,比如ngram模型、神经网络语言模型等。
但是现有的输入法语言模型多使用大众化(即通用)的语言模型,大众化模型很难实现个性化的输出,比如有人问你“你知道我今年多大了吗?”,采用大众化模型得到的回答一般是“不知道”,但是有些用户更喜欢使用“不晓得”或“母鸡呀”等这些更具有个性化的回答;因此这些用户无法从输入法展示的候选信息中选取想要的信息进行回复,而需要手动输入。
发明内容
本发明实施例提供一种输入配置方法,以提高输入效率。
相应的,本发明实施例还提供了一种输入配置装置和一种电子设备,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种输入配置方法,具体包括:输入法获取通用语言模型,记录用户的输入信息,其中,所述通用语言模型依据全网用户的输入信息训练得到;采用所述用户的输入信息对所述通用语言模型进行训练,得到所述用户对应的个性化语言模型;依据所述个性化语言模型匹配候选信息。
可选地,所述采用所述用户的历史输入信息对所述通用语言模型进行训练,得到所述用户对应的个性化语言模型,包括:筛选出设定时间内所述用户的输入信息,对所述筛选的输入信息进行预处理得到预处理数据;将所述预处理数据输入至所述通用语言模型中进行训练,得到所述用户对应的个性化语言模型。
可选地,所述对所述筛选的输入信息进行预处理得到预处理数据,包括:对筛选的输入信息进行分词,得到对应的词片段;依据映射关系确定各词片段对应的信息编号,并将所述信息编号确定为预处理数据。
可选地,所述将所述预处理数据输入至所述通用语言模型中进行训练,得到所述用户对应的个性化语言模型,包括:对所述预处理数据进行M次划分,其中,所述预处理数据每次被划分为N组;分别将M次划分的N组预处理数据输入至通用语言模型中,对通用语言模型进行M轮训练得到所述用户对应的个性化语言模型;其中,M是小于设定阈值的正整数,N为大于0的整数。
可选地,对通用语言模型进行一轮训练包括:将一次划分的N组预处理数据分别输入至通用语言模型中,对所述通用语言模型进行N次训练。
可选地,还包括:将所述通用语言模型对应的学习率调整为目标学习率。
可选地,所述候选信息包括以下至少一种:输入序列对应的候选信息、联想候选信息、智能回复候选信息。
可选地,所述个性化语言模型包括个性化对话模型。
本发明实施例还公开了一种输入配置装置,具体包括:获取模块,用于输入法获取通用语言模型,记录用户的输入信息,其中,所述通用语言模型依据全网用户的输入信息训练得到;训练模块,用于采用所述用户的输入信息对所述通用语言模型进行训练,得到所述用户对应的个性化语言模型;匹配模块,用于依据所述个性化语言模型匹配候选信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810443413.5/2.html,转载请声明来源钻瓜专利网。





