[发明专利]数据识别方法、装置、电子设备及计算机可读存储介质在审
申请号: | 201810069821.9 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108319975A | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 孙鹏飞;张昊 | 申请(专利权)人: | 北京墨丘科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 钟文芳 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练模型 计算机可读存储介质 电子设备 数据识别 机器学习模型 海量数据 获取数据 输出结果 数据交换 客户端 筛选 交易 | ||
本公开实施例公开了数据识别方法、装置、电子设备及计算机可读存储介质。所述方法运行在客户端,包括:获取数据;将所述数据输入到至少一个预训练模型中;所述预训练模型为预先经过训练的机器学习模型;根据所述至少一个预训练模型的输出结果确定所述数据的有用性。通过本公开的上述方式能够从海量数据中筛选出有用数据,为数据交换或交易提供了平台。
技术领域
本公开涉及智能识别技术领域,具体涉及一种数据识别方法、装置、电子设备及计算机可读存储介质。
背景技术
近年来人工智能技术得到了飞速发展并逐步应用到更多的行业和领域中,其中的主要原因是机器学习作为一个分支得到了突破性的进展。机器学习方法作为人工智能的一个分支,能够通过训练数据的增加而不断提升人工智能完成任务的性能。也就是说,人工智能技术的发展来自于将任务建立在利用更多的有用数据的方法之上。例如,机器学习中的一个分支深度学习就能够通过不断使用更多的训练数据,得到了传统人工智能方法无法达到的水平,进而使得过去只能停留在实验室的技术可以在工业和民用领域得到实际应用。
发明内容
本公开实施例提供一种数据识别方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例中提供了一种数据识别方法,所述方法运行在客户端,包括:
获取数据;
将所述数据输入到至少一个预训练模型中;所述预训练模型为预先经过训练的机器学习模型;
根据所述至少一个预训练模型的输出结果确定所述数据的有用性。
其中,根据所述至少一个预训练模型的输出结果确定所述数据的有用性,包括:
根据所述至少一个预训练模型的输出结果的可信度确定所述数据的有用性。
其中,根据所述至少一个预训练模型的输出结果确定所述数据的有用性,包括:
在所述至少一个预训练模型预测出至少两种可能的输出结果时,确定所述数据的有用性大于第一预设阈值;和/或
在所述至少一个预训练模型没有预测出可能的输出结果时,确定所述数据的有用性大于第一预设阈值。
其中,根据所述至少一个预训练模型的输出结果确定所述数据的有用性,还包括:
将所述至少一个预训练模型的输出结果提供给用户;
根据接收到的用户反馈信息确定所述数据的有用性。
其中,根据接收到的用户反馈信息确定所述数据的有用性,包括:
在所述用户的反馈信息与所述输出结果一致时,确定所述数据的有用性大于第一预设阈值。
其中,所述方法还包括:
在确定出所述数据的有用性大于第一预设阈值时,将所述数据发送至所述服务器。
其中,在确定出所述数据的有用性大于第一预设阈值时,方法还包括以下至少之一:
向用户提供是否将所述数据发送至服务器的请求,并在接收到用户对所述请求的确认答复后,将所述数据发送至所述服务器;
获取所述数据的标注结果,并将所述数据和所述标注结果发送至所述服务器;
获取所述数据的有用性大于所述第一预设阈值所针对的一个或多个所述预训练模型,并将所述数据和所述一个或多个预训练模型发送至服务器。
其中,所述方法还包括:
从服务器获取与预设属性信息相匹配的一个或多个预训练模型。
第二方面,提供了一种数据识别装置,所述装置运行在客户端上,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京墨丘科技有限公司,未经北京墨丘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810069821.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置、存储介质和电子装置
- 下一篇:建图方法及装置