[发明专利]一种数据识别方法及装置有效
| 申请号: | 201811223397.5 | 申请日: | 2018-10-19 |
| 公开(公告)号: | CN109359689B | 公开(公告)日: | 2021-06-04 |
| 发明(设计)人: | 陆磊;吴子扬 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
| 地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 识别 方法 装置 | ||
1.一种数据识别方法,其特征在于,包括:
利用预先训练得到的识别模型对待识别数据进行识别;
其中,按照下述方式训练得到所述识别模型;
分别获取至少两个数据收集场景下的场景数据集合,所述场景数据集合对应至少一个数据分类和至少一个数据分组,所述数据分类下包括经配对标注后的对应于同一识别对象的至少两个已配对数据,所述数据分组下包括未经配对标注的对应于同一识别对象的至少两个未配对数据;
若所述场景数据集合对应至少一个数据分组,则将所述数据分组下的未配对数据分配至目标数据集合中,所述目标数据集合为不同于所述场景数据集合的另一场景数据集合;
利用数据分配后的各个场景数据集合进行模型训练,训练得到所述识别模型。
2.根据权利要求1所述的方法,其特征在于,所述至少两个未配对数据是在连续时段内通过跟踪对应识别对象得到的。
3.根据权利要求1所述的方法,其特征在于,所述利用数据分配后的各个场景数据集合进行模型训练,包括:
确定所述数据分组下的未配对数据在所述目标数据集合中对应的数据分类;
利用数据分配后的各个场景数据集合以及每一场景数据集合对应的数据分类,进行模型训练。
4.根据权利要求3所述的方法,其特征在于,所述确定所述数据分组下的未配对数据在所述目标数据集合中对应的数据分类,包括:
将所述数据分组下的未配对数据,平均分配给所述目标数据集合中的每一已有数据分类;
或者,在所述目标数据集合下创建一个新的数据分类,并将所述数据分组下的未配对数据分配给所述新的数据分类;
或者,将所述数据分组下的未配对数据,分配给所述目标数据集合中一个已有数据分类。
5.根据权利要求3或4所述的方法,其特征在于,所述进行模型训练,包括:
利用不同目标损失函数对所述已配对数据及所述未配对数据进行模型训练;
其中,在采用所述已配对数据进行模型训练时,所述目标损失函数用于区别各个数据分类、并用于聚合相同数据分类中的数据以及区分不同数据分类中的数据;在采用所述未配对数据进行模型训练时,所述目标损失函数用于区别各个数据分类、并用于聚合相同数据分类中的数据且不能区分不同数据分类中的数据。
6.一种数据识别装置,其特征在于,包括:
数据识别单元,用于利用预先训练得到的识别模型对待识别数据进行识别,其中,所述识别模型通过集合获取单元和模型训练单元训练得到;
所述集合获取单元,用于分别获取至少两个数据收集场景下的场景数据集合,所述场景数据集合对应至少一个数据分类和至少一个数据分组,所述数据分类下包括经配对标注后的对应于同一识别对象的至少两个已配对数据,所述数据分组下包括未经配对标注的对应于同一识别对象的至少两个未配对数据;
所述模型训练单元,所述模型训练单元包括:第一数据分配子单元,用于若所述场景数据集合对应至少一个数据分组,则将所述数据分组下的未配对数据分配至目标数据集合中,所述目标数据集合为不同于所述场景数据集合的另一场景数据集合;第一模型训练子单元,用于利用数据分配后的各个场景数据集合进行模型训练,训练得到所述识别模型。
7.根据权利要求6所述的装置,其特征在于,所述至少两个未配对数据是在连续时段内通过跟踪对应识别对象得到的。
8.根据权利要求6所述的装置,其特征在于,所述第一模型训练子单元包括:
数据分类确定子单元,用于确定所述数据分组下的未配对数据在所述目标数据集合中对应的数据分类;
第二模型训练子单元,用于利用数据分配后的各个场景数据集合以及每一场景数据集合对应的数据分类,进行模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811223397.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





