[发明专利]基于众包的用户文本输入从头开始学习语言模型在审
申请号: | 201580021809.5 | 申请日: | 2015-04-13 |
公开(公告)号: | CN106233375A | 公开(公告)日: | 2016-12-14 |
发明(设计)人: | 伊森·R·巴福德;西蒙·克斯顿;唐尼·马凯瑞;莱恩·N·克罗斯 | 申请(专利权)人: | 纽昂斯通信有限公司 |
主分类号: | G10L15/183 | 分类号: | G10L15/183 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙)11400 | 代理人: | 邬玥;葛强 |
地址: | 美国马萨*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于集聚和分析来自语言的多个用户的文本输入,从头开始开发用于语言识别系统的语言模型的技术被描述。该技术允许用户选择语言,并且如果没有现有的语言模型可用于所选择的语言,则为所选择的语言提供新的语言模型,监控和收集关于所选择的语言中的单词的使用的信息,组合从所选择语言的多个用户处收集的信息,以及基于来自所选择的语言的多个用户处的组合的信息来更新用户的语言模型。 | ||
搜索关键词: | 基于 用户 文本 输入 从头 开始 学习 语言 模型 | ||
【主权项】:
一种有形的计算机可读存储器,其具有内容被配置为使得至少一个具有处理器的计算机执行用于辅助建立由语言识别系统使用的新的语言模型的方法,所述方法包括:为所选择的语言初始化语言模型,其中使用语言模型来预测在语言中的单词的语言识别系统对于预测在所选择的语言中的想要的单词是无效的;监控由所选择的语言的多个用户在各种计算装置上在所选择的语言中对单词的使用;基本上实时地收集关于由所选择的语言的所述多个用户对所选择的语言中的所述单词的所监控的使用的信息;基于关于在所选择的语言中的所述单词的所监控的使用所收集的信息,生成对所述语言模型的更新;以及提供所生成的对所述语言模块的更新至所述各种计算装置,使得使用包括所生成的更新的所述语言模块的语言使用识别系统对预测在所选择的语言中的想要的单词更加有效。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯通信有限公司,未经纽昂斯通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201580021809.5/,转载请声明来源钻瓜专利网。