[发明专利]基于机器学习的自动任务分类有效
| 申请号: | 201480039347.5 | 申请日: | 2014-11-25 |
| 公开(公告)号: | CN105378699B | 公开(公告)日: | 2018-12-18 |
| 发明(设计)人: | H·S·申;R·苏基坦;S·慕克吉;尹红风;Y·孙;秋永和计;P·苏巴希奇 | 申请(专利权)人: | NTT都科摩公司 |
| 主分类号: | G06F15/18 | 分类号: | G06F15/18 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 武晨燕;迟姗 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 机器 学习 自动 任务 分类 | ||
提供了一种系统和方法,其使用机器学习算法处理多个任务类别中的每一个中的人工生成的请求的训练数据库,以开发任务分类器模型,该任务分类器模型可以应用于随后的用户请求以为随后的用户请求确定任务类别中最可能的一个。
相关申请
本申请要求2013年11月27日提交的美国临时专利申请61/909,992的权益,将该临时申请的全部内容并入本文中。
技术领域
本公开大体上涉及个人助理应用,并且更具体地,涉及基于机器学习的用户请求的处理。
背景技术
已经开发了各种个人助理软件应用,它们通过执行相应任务而响应用户的文本或自然语言请求。例如,由智能手机用户访问的个人助理应用可以查找电话号码并且拨打电话,搜索餐馆,起草和发送电子邮件,制定日历项等等。在这方面,特定用户可能通常以与其他用户不同的措辞来表达给定任务的请求。这种差异在人工交互方面是固有的。由于这种差异,传统的个人助理软件应用在正确地执行用户的期望请求方面容易出错。此外,最终的应用趋向于临时性的并且因此难以应用于不同的语言。
因此,在本领域内存在对于独立于语言的改进系统的需求,其在分类和执行用户所需的任务方面具有更好的精确度。
发明内容
为了提供针对任务分类和执行的更高精确度,提供了利用机器学习算法进行任务分类的系统和方法。针对用户如何表达多个任务类别中的请求,从各种用户生成训练数据库。通过调查足够多的用户,单个用户如何表达给定的期望任务的自然变化可以被恰当地采样。例如,针对呼叫特定方(例如,其母亲)的任务,一个用户可以将其表达为“呼叫妈”,而另一用户可能将其表达为“请呼叫妈”或者“呼叫母亲”。例如,可以通过众包(crowdsourcing)生成相对大的训练数据库以表征给定的任务被不同用户表达的方式的这些变化。最终的训练数据库可以包含数以千计的用户针对请求多个任务类别中的特定任务的响应。由于已知用户期望特定的任务的先验,最终的用户请求对于其分类是明确的。因此,训练数据库可以具有各种用户请求的大量实例,其全部都被组织到其适当的任务类别中。
随后,可以通过各种机器学习算法利用这种高质量训练数据库。例如,每个数据库用户请求可以被转换成特征向量或者其他数学表示。因此,训练数据库将会包括对于每个任务类别的各种特征向量,每个特征向量对应于给定的训练数据库用户的请求。每个特征向量的维数取决于期望的复杂度。例如,给定用户的请求中的每个独一的词(或词组)可以对应于特征向量维度。每个特征向量维度的权重可以取决于相应的词或词组在相应的用户的请求中出现了多少次。可选地,权重可以是二进制的,从而加权仅仅取决于给定的词或词组是否在用户请求中出现。然后,最终的特征向量可以用于训练机器学习算法,例如支持向量机,以确定每个任务的各种用户请求是如何在特征向量空间中集群的任务分类器模型。
由于在对于各种任务的人工生成的请求的高质量训练数据库上进行这种先验机器学习以形成任务分类器模型,额外用户请求就可以根据任务分类器模型被稳健地实时分类。换言之,接收的用户请求可以被轻易地转换成文本(在自然语言输入的情况下),并且相应的文本根据预先确定的任务分类器模型被转换成特征向量并被分类成任务类别中的预测任务类别。这个过程不仅增加了任务分类的精确度,还是不依赖于语言的:仅仅需要收集其他语言的训练数据库以扩展该过程,从而适应相应语言的用户请求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于NTT都科摩公司,未经NTT都科摩公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480039347.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:便于吸收的节能加热炉
- 下一篇:一种新型暖风芯体





