[发明专利]一种低延迟的机器学习即服务的生成方法在审
申请号: | 201910796537.6 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110490334A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 李攀登 | 申请(专利权)人: | 上海丙晟科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F17/50;G06K9/62;G06N3/08 |
代理公司: | 11616 北京盛凡智荣知识产权代理有限公司 | 代理人: | 赵芳蕾<国际申请>=<国际公布>=<进入 |
地址: | 200040 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种低延迟的机器学习即服务的生成方法,模型抽象层提供了一个通用的API,可以抽象出现有机器学习框架和模型的异构性;模型参数寻优层位于模型抽象层的上方,负责动态选择、组合和优化预测模型的参数;模型管理层通过模型存储层的信息对模型进行管理,以实现应用端可以动态并无感知的情况下获取最优的预测服务;事件服务层,这层负责与应用端交互,并存储应用端用户请求的信息,反馈给模型层,以实现动态自动优化模型参数;模型监测层负责对上线模型服务的调用监测,以及时发现调用过程中出现的问题,提高模型运维的透明性。降低现有预测服务栈的复杂性,并实现预测服务的低延迟、高吞吐量、模型准确性等关键属性。 | ||
搜索关键词: | 预测服务 机器学习 模型参数 抽象层 低延迟 应用端 调用 模型准确性 存储应用 动态选择 高吞吐量 关键属性 模型存储 模型监测 事件服务 预测模型 自动优化 端用户 管理层 模型层 通用的 异构性 上线 寻优 运维 感知 抽象 反馈 服务 监测 优化 发现 管理 | ||
【主权项】:
1.一种低延迟的机器学习即服务的生成方法,其特征在于,包括:模型抽象层、模型参数寻优层、模型存储层、模型管理层、事件服务层、模型监测层;/n模型抽象层提供了一个通用的 API,可以抽象出现有机器学习框架和模型的异构性,这一层模型可以被修改或直接交给应用程序;/n模型参数寻优层位于模型抽象层的上方,负责动态选择、组合和优化预测模型的参数,以提供比原始模型更准确和可靠的预测,这一层产生的模型参数或模型文件会上传到模型存储层,并通过主节点分发给每个工作节点,告知工作节点新模型的名称、参数实体以及版本号;/n模型管理层通过模型存储层的信息对模型进行管理,以实现应用端可以动态并无感知的情况下获取最优的预测服务;/n事件服务层,这层负责与应用端交互,并存储应用端用户请求的信息,反馈给模型层,以实现动态自动优化模型参数;/n模型监测层负责对上线模型服务的调用监测,以及时发现调用过程中出现的问题,提高模型运维的透明性。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海丙晟科技有限公司,未经上海丙晟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910796537.6/,转载请声明来源钻瓜专利网。