[发明专利]一种基于特征和样本对抗共生的多任务学习方法及其系统在审
申请号: | 202010594893.2 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111767949A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 谭琦;杨沛 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李盛洪 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 样本 对抗 共生 任务 学习方法 及其 系统 | ||
本发明涉及多任务深度学习领域,其提供了一种基于特征和样本对抗共生的多任务学习方法,包括以下步骤:S1、随机抽取任务的样本,生成与领域无关的共性隐式特征;S2、基于步骤S1中生成的共性隐式特征,生成高仿真的样本,该高仿真的样本作为步骤S1下一循环的任务样本;S3、循环步骤S1和S2,直到多任务的对抗博弈达到均衡时,生成最终的高仿真样本和高质量分类标签;本发明还提供了一种基于特征和样本对抗共生的多任务学习系统;本发明解决了领域分布差异和小样本问题,将极大提高机器学习系统的泛化性能,从而推动人工智能的诸多应用领域取得突破。本发明不但适用于多任务学习和迁移学习,也适用于多视图学习和多模态学习。
技术领域
本发明涉及多任务深度学习领域,特别是涉及一种基于特征和样本对抗共生的多任务学习方法及其系统。
背景技术
深度学习源于人工神经网络的研究,目前在人工智能的很多领域的应用上都有突出的表现。深度学习和大数据已是学术研究和商业需求的一个重要方向。但是,目前的研究表明,即使是主流的深度神经网络,并且用上百万个样本训练过,它也很容易受到领域数据分布差异的影响,导致学习性能急剧下降。
因此,人们越来越关注深度多任务学习。异构性是大数据的一个关键属性,它无所不在,而且类型多样,例如领域异构性。在迁移学习和多任务学习中,不同领域(或者任务)的数据样本往往不会满足独立同分布的条件。而在迁移学习、多视图学习和多模态学习中,数据的特征空间往往又是不同的。深度多任务学习从“深度”和“宽度”这两个不同的维度,来挖掘隐含的数据关联。一方面,通过深度网络模型来挖掘数据的层次化特征;另一方面,通过多任务学习来实现知识共享和知识迁移,有效地提升机器学习系统的泛化性能。
但是目前,深度多任务学习大多是基于模型和特征的方法,难以突破小样本问题,即标记样本稀少导致的性能瓶颈问题。对抗生成网络技术可以生成高仿真的数据样本,为解决小样本问题提供新颖的思路。因此,我们认为,如果基于对抗的深度异构学习,能够同时解决小样本问题和数据异构问题,将会极大提高机器学习系统的泛化性能,从而推动人工智能的诸多应用领域取得突破,例如:图像分析、语音识别、自然语言处理、基因分析、强化学习等领域。
但是,基于对抗的深度异构学习仍处于发展的早期,存在很多需要解决的问题。例如:如何解决数据分布差异和特征解构的问题,以分离共性特征和个性特征,并且平滑数据分布差异。综上所述,我们很有必要提供一种基于特征和样本共生的深度多任务学习方法,以解决目前研究存在的问题,并推进人工智能的研究进展。
发明内容
本发明的目的在于克服现有技术中的上述缺陷,提供一种基于特征和样本对抗共生的多任务学习方法及其系统,解决领域分布差异和小样本问题,极大提高机器学习系统的泛化性能。
为实现上述目的,本发明提供了一种基于特征和样本对抗共生的多任务学习方法,包括以下步骤:
S1、随机抽取任务的样本,生成与领域无关的共性隐式特征;
S2、基于步骤S1中生成的共性隐式特征,生成高仿真的样本,该高仿真的样本作为步骤S1下一循环的任务样本;
S3、循环步骤S1和S2,直到多任务的对抗博弈达到均衡时,生成最终的高仿真样本和高质量分类标签。
优选的,步骤S1中具体的:任务样本输入到特征提取器中去,特征提取器生成包含领域共性的隐式特征,然后领域鉴别器对隐式特征进行关联领域的判别,并且产生领域标签,特征提取器和领域鉴别器进行对抗博弈,以生成包含领域共性的隐式特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010594893.2/2.html,转载请声明来源钻瓜专利网。