[发明专利]一种标注策略的选择方法及相关装置有效
申请号: | 201711408351.6 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108182448B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 赵开云;何朋 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 100025 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种标注策略的选择方法,包括:采用多个标注策略对已标注数据集进行模拟标注处理和监督学习训练,并根据处理过程中的指标数据进行回归预测模型训练,得到对应的回归预测模型;当获取到标注任务的指标数据时,利用所有回归预测模型根据指标数据进行预测计算处理,得到预测结果;根据预测结果和预期结果,确定人力成本最小的标注策略作为使用的标注策略。通过获取模拟标注处理中指标数据进行训练得到回归预测模型,可以实现‑对该标注策略‑进行预测,进而根据预测结果确定人力成本最小的标注策略,保证训练效果的情况下降低人力成本。本申请还公开了一种标注策略的选择装置、服务器以及计算机可读存储介质,具有上述有益效果。 | ||
搜索关键词: | 一种 标注 策略 选择 方法 相关 装置 | ||
【主权项】:
1.一种标注策略的选择方法,其特征在于,包括:采用多个标注策略对已标注数据集进行模拟标注处理和监督学习训练,并根据所述模拟标注处理和所述监督学习训练中的指标数据进行回归预测模型训练,得到对应的回归预测模型;其中,所述指标数据包括标注准确率、识别准确率以及数据量;当获取到标注任务的目前标注准确率、已标注数据量以及预期标注数据量时,利用所有所述回归预测模型根据所述目前标注准确率、所述已标注数据量以及预期标注数据量进行预测计算处理,得到对应的预测识别准确率;根据所有所述预测识别准确率和预期识别准确率,确定人力成本最小的标注策略作为所述标注任务中使用的标注策略;其中,所述人力成本为根据标注策略中的标注方式和预期标注数据量计算得到的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711408351.6/,转载请声明来源钻瓜专利网。