[发明专利]减少使用数据库的对话系统的训练在审
申请号: | 202010942350.5 | 申请日: | 2020-09-09 |
公开(公告)号: | CN112487156A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | M·E·约翰逊;M·R·肯纳威克 | 申请(专利权)人: | 甲骨文国际公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G10L15/22;G06F40/295;G06F40/30;G06N20/00 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 魏小薇;吴丽丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 减少 使用 数据库 对话 系统 训练 | ||
本公开涉及减少使用数据库的对话系统的训练。描述了用于使用从数据库导出的数据来训练和执行机器学习模型的技术。对话系统使用来自数据库的数据以生成用于自然语言理解应用的相关训练数据。生成的训练数据随后被用于训练机器学习模型。与传统的标记技术相比,这使对话系统可以利用大量可用数据来加快训练过程。对话系统使用经过训练的机器学习模型从接收到的口头话语中识别命名实体,并基于所识别的命名实体生成并输出语音响应。
相关申请的交叉引用
本申请按照35U.S.C.119(e)要求申请日为2019年9月12日标题为“面向数据库的对话技术”的美国申请62/899,647的权益和优先权,出于所有目的,通过引用将其内容全部合并于本文。
技术领域
本公开总体上涉及对话系统。更具体地但非限制性地,本公开描述了用于提高训练效率和将机器学习模型应用到使用数据库的对话处理任务的技术。
背景技术
现在,越来越多的设备使用户能够使用声音或口头语音与设备直接进行交互。例如,对于用户可以提出问题或进行陈述以请求执行某些动作的设备,用户可以用自然语言与这种设备对话。作为响应,设备执行请求的动作或使用声音输出响应用户的问题。由于使用声音直接交互是人类与周围环境进行交流的一种更自然,更直观的方式,因此这种基于语音的系统的普及正以天文数字的速度增长。
在常规系统中,对话系统使用已经在标记数据上训练过的机器学习模型。传统上,对数据进行标记是由人工完成,并且会是一个繁琐且耗时的过程。通常,用于训练模型的数据越多,模型能够进行预测的准确性就越高。但是,用大量训练数据来改进模型的愿望与手工标记大数据语料库的实践之间存在矛盾。
发明内容
本公开总体上涉及对话系统。更具体地,描述了一种技术,用于使用数据库来训练机器学习模型,该机器学习模型随后被用于响应于声音输入来执行任务。本文描述了各种实施例,包括方法、系统、存储程序的非暂态计算机可读存储介质、代码、由一个或多个处理器执行的指令等。
在某些实施例中,对话系统接收口头话语。对话系统使用机器学习模型从口头话语中别命名实体。机器学习模型已经在从数据库提取的数据上进行了训练,该数据库基于数据库中的列将多个命名实体映射到相应的命名实体类型。对话系统基于所识别的命名实体生成语音响应,并提供语音响应作为输出。
在一些方面,对话系统还从数据库提取原始数据,从提取的原始数据生成训练数据,并且在所生成的训练数据上训练机器学习模型。在一些方面,生成训练数据包括识别与数据库的列相关联的元数据,并且使用元数据和列的对应条目作为种子数据来生成训练数据。在一些方面,机器学习模型是第一机器学习模型,并且命名实体是第一命名实体,并且该方法进一步包括使用第二机器学习模型来识别第二命名实体。
在一些方面,数据库进一步包括多个可请求值,并且该方法进一步包括,由对话系统使用数据库,识别多个可请求值中的映射到所识别的命名实体的可请求值,其中语音响应包括可请求值或其派生物。
在一些方面,数据库包括多个表格,并且该方法还包括基于所识别的命名实体从多个表格中选择特定表格,其中,所选择的表格用于识别可请求值。在一些方面,识别可请求值包括对所选择的表格执行查询以检索映射到所识别的命名实体的可请求值。
实施例还包括被配置用于执行本文描述的方法的系统和计算机可读介质(例如,非暂态计算机可读存储器)。
通过参考以下说明书,权利要求书和附图,前述以及其他特征和实施例将变得更加显而易见。
附图说明
图1A和1B是描述根据某些实施例的对话系统的简化框图。
图2是描述根据某些实施例的方法的简化流程图,该方法用于使用机器学习模型来处理语音输入,该机器学习模型已经在从数据库导出的数据上进行了训练。
图3是描述根据某些实施例的方法的简化流程图,该方法用于训练在图2方法中使用的机器学习模型。
图4是描述根据某些实施例的方法的简化流程图,该方法用于使用数据库来回答查询。
图5A和5B是根据某些实施例的数据库表格的简化示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010942350.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:真空装置、方法和电极的应用
- 下一篇:三维造型装置及三维造型物的制造方法