[发明专利]车辆语言处理在审
申请号: | 201910848707.0 | 申请日: | 2019-09-09 |
公开(公告)号: | CN110890091A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 普拉韦恩·纳拉亚南;丽莎·斯卡里亚;瑞恩·伯克;弗朗索瓦·沙雷特;普纳杰·查克拉瓦蒂;考希克·巴拉科瑞斯南 | 申请(专利权)人: | 福特全球技术公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 杨帆 |
地址: | 美国密歇根*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车辆 语言 处理 | ||
1.一种方法,其包括:
响应于发出口头语言提示而接收口头语言命令;
用广义对抗神经网络(GAN)处理所述口头语言命令以确定车辆命令;和
基于所述车辆命令来操作车辆。
2.如权利要求1所述的方法,其还包括在用所述GAN处理之前,将所述口头语言命令变换为梅尔频率样本。
3.如权利要求2所述的方法,其中通过在用GAN处理之前沿着y轴卷积梅尔值,将所述梅尔频率样本各自压缩成单个向量。
4.如权利要求3所述的方法,其中梅尔频率标度是口头语言命令频率在非线性频率标度上的对数功率谱。
5.如权利要求4所述的方法,其中用GAN处理所述梅尔频率样本的第一步骤是在X方向上执行1D卷积,以将梅尔频率样本的数量减少到大于1的数量。
6.如权利要求5所述的方法,其中用GAN处理所述梅尔频率样本的第二步骤是在Y方向上执行1D卷积。
7.如权利要求6所述的方法,其中用GAN处理所述梅尔频率样本的第三步骤是用神经网络处理所述梅尔频率样本。
8.如权利要求1所述的方法,其还包括使用多个记录的口头语言命令、将所述记录的口头语言命令识别为真实或虚假的地面实况以及基于地面实况的损失函数来训练所述GAN以确定真实或虚假的口头语言。
9.如权利要求5所述的方法,其中通过将基于来自所述GAN的鉴别器部分的输出的损失函数与基于地面实况的损失函数求和来计算所述损失函数。
10.如权利要求1所述的方法,其中操作所述车辆包括基于所述车辆命令确定路径多项式。
11.如权利要求7所述的方法,其中操作所述车辆包括基于车辆传感器数据确定认知映射图。
12.如权利要求8所述的方法,其中操作所述车辆包括确定所述认知映射图上的目的地位置并确定将允许所述车辆到达所述目的地位置的路径多项式。
13.如权利要求1所述的方法,其还包括用GAN处理合成语言数据以确定所述口头语言提示。
14.如权利要求1所述的方法,其中所述车辆命令是对所述车辆的目标指向行为的请求。
15.一种系统,其包括计算机,所述计算机被编程为执行如权利要求1至14中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福特全球技术公司,未经福特全球技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910848707.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于裸片接合期间的自对准的裸片特征
- 下一篇:浅景深渲染中语义分割的稳健用途