[发明专利]使用自动编码器神经网络压缩端节点中的信息在审
| 申请号: | 202111092879.3 | 申请日: | 2021-09-17 |
| 公开(公告)号: | CN114282644A | 公开(公告)日: | 2022-04-05 |
| 发明(设计)人: | A·托里尼;J·埃琳娜斯 | 申请(专利权)人: | 硅实验室公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08;G06K9/62;G06V10/764;G06V10/82 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李雪娜;周学斌 |
| 地址: | 美国德*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 自动 编码器 神经网络 压缩 端节 中的 信息 | ||
在一个实施例中,一种装置包括:传感器,用于感测真实世界信息;数字化器,其耦合到传感器以将真实世界信息数字化为数字化信息;信号处理器,其耦合到数字化器以将数字化信息处理成频谱图;神经引擎,其耦合到信号处理器,神经引擎包括自动编码器,用于将频谱图压缩成经压缩的频谱图;以及无线电路,其耦合到神经引擎以将经压缩的频谱图发送到远程目的地,以使远程目的地能够处理经压缩的频谱图。
背景技术
端节点设备通常感测和收集关于其环境的数据。例如,这种数据可以是音频或图像。通常不容许端节点对这种数据执行有意义的计算,例如进行语音识别以检测关键字或检测图像中人的存在。因此,端节点通常会将原始数据发送到云,在云中使用强大的机器学习算法来处理原始数据。然而,原始数据的传输需要带宽和功耗,这对于电池供电的设备或其他功率受限的设备而言可能是惊人地大。
发明内容
在一个方面,一种装置包括:传感器,用于感测真实世界信息;数字化器,其耦合到所述传感器以将所述真实世界信息数字化为数字化信息;信号处理器,其耦合到所述数字化器以将所述数字化信息处理成频谱图;神经引擎,其耦合到所述信号处理器,所述神经引擎包括自动编码器,所述自动编码器用于将所述频谱图压缩成经压缩的频谱图;以及,无线电路,其耦合到所述神经引擎以将所述经压缩的频谱图发送到远程目的地,以使得所述远程目的地能够处理所述经压缩的频谱图。
在一个示例中,神经引擎用于存储用于自动编码器的模型。该模型可以包括神经网络的结构和多个系数,并且可以是根据真实世界类型的信息使用至少一个相关函数生成的预训练模型。该装置可以从远程目的地接收更新的模型,并且基于更新的模型来更新模型的多个系数权重中的至少一些系数权重。自动编码器的解码器可以将第一经压缩的频谱图解压缩成第一重构频谱图,该第一经压缩的频谱图由自动编码器的编码器从第一频谱图压缩。
在一个示例中,该装置可以将第一频谱图与第一重构频谱图进行比较,并且至少部分地基于该比较将第一频谱图而不是第一经压缩的频谱图发送至远程目的地。该装置可以响应于来自远程目的地的请求将第一频谱图与第一重构频谱图进行比较。
在一个示例中,真实世界信息包括了语音信息,该装置包括语音控制的端节点设备。语音控制的端节点设备可以至少部分地基于经压缩的频谱图从远程目的地接收至少一个命令。真实世界信息可以是图像信息,并且该装置可以至少部分地基于图像信息,基于在远程目的地检测到图像信息中的人,响应于来自远程目的地的命令而采取动作。
在另一方面,一种方法包括:生成包括编码器和解码器的自动编码器,并生成分类器,其中,编码器用于将频谱图编码为经压缩的频谱图,解码器用于将经压缩的频谱图解码为恢复的频谱图,并且分类器用于从解码的压缩的频谱图确定至少一个关键字;计算自动编码器的第一损失并计算分类器的第二损失;至少部分地基于所述第一损失和所述第二损失来联合训练所述自动编码器和所述分类器;以及,将经训练的自动编码器和经训练的分类器存储在非暂时性存储介质中。
在一个示例中,该方法还包括基于所述第一损失与所述第二损失的加权和来联合训练所述自动编码器和所述分类器。该方法还可以包括:根据相关系数计算第一损失;根据二元交叉熵计算第二损失。该方法还可包括将自动编码器的经训练的编码器部分发送到一个或多个端节点设备以使该一个或多个端节点设备能使用该经训练的编码器部分来压缩频谱图。该方法还可以包括从解码器不对称地生成编码器。
在又一方面,一种语音控制的设备可以包括:麦克风,用于接收语音输入;数字化器,其耦合到所述麦克风以将所述语音输入数字化为数字化信息;信号处理器,其耦合到所述数字化器以从所述数字化信息生成频谱图;控制器,其耦合到信号处理器,该控制器包括自动编码器的编码器,用于将频谱图压缩成对应于语音输入的经压缩的频谱图;以及,无线电路,其耦合到所述控制器,以将所述经压缩的频谱图发送到远程服务器,以使所述远程服务器能够处理所述经压缩的频谱图。响应于来自远程服务器的命令,控制器可以使无线电路向远程服务器发送与另一语音输入相对应的未压缩频谱图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于硅实验室公司,未经硅实验室公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111092879.3/2.html,转载请声明来源钻瓜专利网。





