[发明专利]大数据量和高并发场景下提升GPU显卡计算效率的系统在审
| 申请号: | 202111096450.1 | 申请日: | 2021-09-17 |
| 公开(公告)号: | CN114237922A | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 唐亮;曹特磊;赵伟 | 申请(专利权)人: | 时趣互动(北京)科技有限公司 |
| 主分类号: | G06F9/54 | 分类号: | G06F9/54;G06F16/35 |
| 代理公司: | 北京智慧亮点知识产权代理事务所(普通合伙) 11950 | 代理人: | 史明罡 |
| 地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据量 并发 场景 提升 gpu 显卡 计算 效率 系统 | ||
1.大数据量和高并发场景下提升GPU显卡计算效率的系统,包括:客户端、CPU服务器、3台用于RPC服务的服务器和GPU显卡,其特征在于,所述客户端用于发送并发数据请求,所述CPU服务器用来接收数据处理请求和将请求轮询转发给后续的处理端,所述GPU显卡具有模型计算服务。
2.根据权利要求1所述的大数据量和高并发场景下提升GPU显卡计算效率的系统,其特征在于,所述CPU服务器部署开源的haproxy请求转发服务,用来接收客户端发来的请求,并通过轮询的方式转发给RPC服务。
3.根据权利要求2所述的大数据量和高并发场景下提升GPU显卡计算效率的系统,其特征在于,3台用于RPC服务的所述服务器均采用开源的thrift服务充当RPC服务,进一步放大对GPU显卡的并发请求度。
4.根据权利要求3所述的大数据量和高并发场景下提升GPU显卡计算效率的系统,其特征在于,所述CPU服务器接收用thrift启动的RPC服务发来的经过放大并发量的计算请求,通过轮询的方式转发给GPU显卡上启动的模型计算服务。
5.根据权利要求4所述的大数据量和高并发场景下提升GPU显卡计算效率的系统,其特征在于,所述GPU显卡启动三个舆情模型的计算服务,用来实际计算文本的舆情分类任务。
6.根据权利要求5所述的大数据量和高并发场景下提升GPU显卡计算效率的系统,其特征在于,所述模型计算服务计算完成后,可按流程编号的逆序,将结果返回给客户端,上述采用的开源部署框架,都支持双向的数据请求和传输。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于时趣互动(北京)科技有限公司,未经时趣互动(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111096450.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种成像方法和系统
- 下一篇:一种氢燃料电池发电系统安全性的试验系统





