[发明专利]神经网络及对象识别的方法在审
申请号: | 201910222514.4 | 申请日: | 2019-03-22 |
公开(公告)号: | CN110969239A | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 崔俊辉;金映锡;朴贞训;玉成民;全在勳 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王凯霞;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 对象 识别 方法 | ||
公开了神经网络及对象识别的方法。公开了一种包括第一网络和第二网络的神经网络的操作方法,所述操作方法包括:使用第一网络获得基于输入信息输出的状态信息;使用第二网络确定状态信息是否满足预设条件;响应于状态信息被确定为不满足所述条件,将状态信息迭代地应用于第一网络;响应于状态信息被确定为满足所述条件,输出状态信息。
本申请要求于2018年9月28日提交到韩国知识产权局的第10-2018-0115882号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
以下描述涉及神经网络以及神经网络的操作方法和训练方法。
背景技术
神经网络是具有一定数量的层或运算的架构或结构,其中,针对许多不同的机器学习算法而提供一定数量的层或运算,以一起工作、处理复杂的数据输入并且识别模式。通常,神经网络采用深度神经网络(DNN)的形式以确保针对特征向量的高转换(translation)能力或高性能。然而,DNN包括具有各种权重的多个层,并且使用用于存储多个层的大的存储空间。此外,循环网络(例如,被配置为处理序列数据的循环神经网络(RNN))执行期望的迭代次数(例如,序列数据的长度)的运算。因此,除了序列数据之外,不容易应用于一般的特征向量。此外,如果序列数据的长度太长,则处理时间也增加。
发明内容
提供本发明内容以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不意在标识所要求保护的主题的关键特征或必要特征,也不意在用于帮助确定所要求保护的主题的范围。
在一个总体方面,一种包括第一网络和第二网络的神经网络的操作方法包括:使用第一网络获得基于输入信息输出的状态信息;使用第二网络确定状态信息是否满足预设条件;响应于状态信息被确定为不满足所述条件,将状态信息迭代地应用于第一网络;响应于状态信息被确定为满足所述条件,输出状态信息。
确定的步骤可包括:将预设阈值与从第二网络输出的与状态信息对应的评估结果进行比较。
确定的步骤还可包括:将预设迭代次数与状态信息被迭代地应用于第一网络的次数进行比较。
第一网络可被配置为迭代地处理输入信息,以提供预设应用服务,第二网络可被配置为对与第一网络的迭代处理结果对应的状态信息进行评估。
神经网络的操作方法还可包括:使用第三网络对状态信息进行解码,以提供预设应用服务。
神经网络的操作方法还可包括:将输入信息编码到状态信息的维度;将编码的输入信息应用于第一网络。
迭代地应用的步骤可包括:将状态信息编码到输入信息的维度;将编码的状态信息应用于第一网络。
输入信息可包括单个数据和序列数据中的至少一个。
神经网络的操作方法还可包括:响应于输入信息为序列数据,将序列数据编码为具有第一网络的输入维度的嵌入向量;将嵌入向量应用于第一网络。
输出的步骤可包括:响应于输入信息为序列数据,将状态信息解码为序列数据,并且输出解码的状态信息。
第一网络可包括用于语音识别的神经网络或者用于图像识别的神经网络。
第一网络可包括全连接层、简单的循环神经网络、长短期记忆(LSTM)网络和门控循环单元(GRU)中的至少一个。
在另一总体方面,一种包括第一网络和第三网络的神经网络的训练方法包括:通过基于预设迭代次数将与训练数据对应的输入信息迭代地应用于第一网络,来生成每次迭代的状态信息;使用第三网络预测与每次迭代的状态信息对应的结果;基于每次迭代预测的结果与对应于输入信息的真值之间的第一损失来训练第一网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910222514.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电路参数的检测方法及检测装置
- 下一篇:解码BCH编码码字的系统和方法