首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]推理服务组件的运算方法和TensorRT推理服务组件在审

申请号：	202210004322.8	申请日：	2022-01-04
公开（公告）号：	CN114327958A	公开（公告）日：	2022-04-12
发明（设计）人：	徐守奎;陈舟锋;王义锋;沈炯行	申请（专利权）人：	新华智云科技有限公司
主分类号：	G06F9/54	分类号：	G06F9/54;G06N5/04
代理公司：	杭州裕阳联合专利代理有限公司 33289	代理人：	田金霞
地址：	310012 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	推理服务组件运算方法 tensorrt
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种推理服务组件的运算方法，其特征在于，包括以下步骤：

构建一组以上第一运算对象，获得第一运算队列；

将推理服务模型连接每一所述第一运算对象；

连接所述第一运算对象和TensorRT对象接口，基于所述第一运算对象形成TensorRT对象队列；

获取待处理数据，从所述第一运算队列调取第一运算对象；

将所述待处理数据迁移至显存后，通过所述第一运算对象与所述TensorRT对象实现交互；

获取推理输出结果，将所述推理输出结果迁移至内存输出；

释放所述第一运算对象至第一运算队列。

2.根据权利要求1所述的一种推理服务组件的运算方法，其特征在于，所述推理服务模型的初始化流程，包括步骤：

序列化所述推理服务模型，保存输入尺寸、输入数据和输出尺寸计算输出的数据；

加载模型，解析所述推理服务模型；

分配内存和显存，封装并映射至第一运算对象加入所述第一运算队列。

3.根据权利要求1所述的一种推理服务组件的运算方法，其特征在于，所述第一运算对象的调取和释放的方法，包括步骤：

调取第一运算队列中位于首位的第一运算对象；

执行推理服务，输出推理输出结果后释放所述第一运算对象至第一运算队列末位。

4.根据权利要求2所述的一种推理服务组件的运算方法，其特征在于，还包括推理服务模型的动态输入方法：

通过接口层输入待推理数据，所述待推理数据包括输入尺寸；

根据所述待推理数据、输入尺寸，以及所述输入尺寸和所述输出尺寸的映射关系计算推理输出结果。

5.根据权利要求1所述的一种推理服务组件的运算方法，其特征在于，所述将所述待处理数据迁移至显存的方法，具体包括：

获取待推理数据，将所述待推理数据从内存拷贝至锁页内存，再从所述锁页内存拷贝至显存；

所述将所述推理输出结果迁移至内存输出的方法，具体包括：

将所述推理输出结果从显存拷贝至锁页内存，再从所述锁页内存拷贝至内存输出。

6.根据权利要求1所述的一种推理服务组件的运算方法，其特征在于，执行所述获取推理输出结果，将所述推理输出结果迁移至内存输出之后，还执行步骤：释放GIL锁。

7.一种TensorRT推理服务组件，其特征在于，包括：

接口层，用于待处理数据和推理结果数据与外部的交互；

推理层，包含第一运算队列，所述第一运算队列包括一组以上第一运算对象，每一所述第一运算对象有对应连接的TensorRT对象；每一所述第一运算对象包括预设的推理服务模型；

调度层，从所述接口层获取待处理数据，从所述推理层获取推理输出结果；调取所述第一运算队列的所述第一运算对象，根据所述第一运算对象执行推理服务；释放所述第一运算对象至第一运算队列。

8.根据权利要求1所述的一种TensorRT推理服务组件，其特征在于，还包括插件层，所述插件层连接所述推理层，所述插件层用于提供推理服务模型。

9.一种计算机存储介质，其特征在于，存储有计算机程序，所述计算机程序被执行实现权利要求1-6任一所述的推理服务组件的运算方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司，未经新华智云科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210004322.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种中草药提取、烘干和研磨设备
下一篇：一种含铬ASTM A36钢板及其生产方法

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top