[发明专利]基于少量个性化样本的双网络深度学习方法在审

申请号：	201610546022.7	申请日：	2016-07-12
公开（公告）号：	CN107609566A	公开（公告）日：	2018-01-19
发明（设计）人：	盛益强;赵震宇	申请（专利权）人：	中国科学院声学研究所;上海尚恩华科网络科技股份有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/08
代理公司：	北京方安思达知识产权代理有限公司11472	代理人：	王宇杨,杨青
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于少量个性化样本网络深度学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及通信与数据处理领域，特别涉及基于少量个性化样本的双网络深度学习方法。

背景技术

随着网络技术的快速发展，数据的容量、个性化和多样性快速增加，而处理数据的算法复杂度却难以改善，依赖个人经验和手工操作来描述数据、标注数据、选择特征、提取特征、处理数据的方法，已经很难满足个性化数据快速增长的需求，如何高效处理个性化数据已经成为一个紧迫的难题。

深度学习方法的研究突破，为解决数据处理问题指明了一个值得探索的方向。深度学习可以从大数据中自动提取特征，并通过海量的样本训练获得很好的处理效果。实际上，大数据的快速增长和深度学习的研究是相辅相成的，一方面大数据的快速增长需要一种高效处理海量数据的方法，另一方面深度学习系统的训练需要海量的样本数据。

但是，个性化数据主要是由网络边缘的用户产生的，目前的方法是先对这些数据进行收集，然后再在云端服务器上对这些数据进行分析和处理。这会产生大量的数据传输，同时，对于终端用户来说，从服务器端得到的响应结果是由全局数据训练出的模型响应得到的，对于个性化用户的响应精度较低。如果在终端进行深度学习网络的构建，则由于终端个性化用户的数据量太少，无法对深度学习网络进行训练，这就是存在于目前网络的大数据两难悖论。

目前Apache开发的Hadoop架构，百度开发的参数服务器架构，腾讯开发的Mariana架构等，都是针对分布式大规模、深度学习系统而做出的一些尝试，通过对模型进行拆分，对数据进行拆分等方式，这些系统在一定程度上解决了大规模数据的处理问题。然而，以上的这些分布式系统是将大规模的模型和数据在多机上进行处理，多机之间存在大量的数据通信，这就导致这些分布式系统目前只能应用于局域网络。而终端用户想要获得响应也必须先将数据传输到中心集群上，然后中心机群再将生成的响应发送给终端用户，因此用户端延迟响应很高。

在广域网络中，存在网络带宽的限制、大数据两难悖论、个性化需求等问题，如果能够解决分布式大数据实时处理系统中的通信代价高、边缘用户数据少的问题，则可以有效地将分布式大数据实时处理系统应用于广域网络，提高网络利用率，改善用户体验。

因此，针对少量个性化样本，有必要提供一种更适合于广域网络的分布式数据处理方法，以解决训练数据和模型参数的传输量大，以及当分布式数据存在个性化信息时，处理精度难以提升的问题。

发明内容

本发明的目的在于克服已有的分布式数据处理方法由于边缘用户样本数据少、从而处理精度难以提升的缺陷，从而提供一种基于少量个性化样本的双网络深度学习方法。

为了实现上述目的，本发明提供了一种基于少量个性化样本的双网络深度学习方法，所述双网络包括重构网络与深度网络，该方法包括：

步骤1)、采集少量个性化样本；其中，所述个性化样本包括样本数据及其标签；

步骤2)、利用个性化样本中的样本数据训练所述重构网络，然后将个性化样本中的标签输入经过训练后的重构网络中，生成新的重构数据及其标签；

步骤3)、基于步骤2)所得到的来自重构网络的新的重构数据及其标签训练所述深度网络；

步骤4)、将待测试的数据输入到经过训练的深度网络中，得到S形函数的输出，再经过一个软最大回归从所述S形函数的输出中选择一个结果作为个性化的响应。

上述技术方案中，所述少量个性化样本的数目记为m，m≈M/J，其中的M为用大数据训练相同精度的深度网络时的样本总数，J为通过一个个性化样本重构出的样本的个数。

上述技术方案中，在步骤2)中，所生成的新的重构数据及其标签的集合表示为{x^r_k,y^r_k}；其中，

x^r_k代表任意一个重构数据，y^r_k为该重构数据对应的标签，k的取值为1≤k≤m×J，m为个性化样本数目，J为通过任一个性化样本重构出的样本的个数；J和个性化样本数目m的关系如下：m值越小，J的取值越大，以保证有足够的重构样本m×J来训练深度网络。