[发明专利]一种基于拍卖竞价的沉浸式媒体资源分配方法在审
申请号: | 202310351447.2 | 申请日: | 2023-04-04 |
公开(公告)号: | CN116419399A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 刘雨;魏琳慧;望育梅 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04W72/044 | 分类号: | H04W72/044;G06N20/00;G06Q30/08;H04W4/06;H04B7/185 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 易卜 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 拍卖 竞价 沉浸 媒体 资源 分配 方法 | ||
1.一种基于拍卖竞价的沉浸式媒体资源分配方法,其特征在于,具体步骤如下:
步骤一、构建由I个用户、天地一体化网络和多媒体服务器组成的沉浸式媒体资源分配系统;
步骤二、针对当前沉浸式媒体资源,每个用户根据自身的需求,发起各自的请求信息;结合自己的预算及对当前沉浸式媒体资源的估价进行出价;并观察其他用户上一轮的出价,决定是否继续竞拍还是撤回竞拍;
当用户进行竞拍时,将每个用户作为一个智能体,基于多智能体强化学习算法,根据当前状态更新智能体的行动策略,计算系统效用;并根据计算结果调整智能体策略,使竞价更加合理化;
系统效用包含用户参与竞拍的效用和多媒体服务器的资源利用率两部分;
用户参与竞拍的效用表示为:u=y[(v-p)x+R(1-x)]+(1-y)D;
其中,y表示用户是否撤回此次竞拍,y=1表示撤回;若撤回竞拍,需要支付固定费用的撤回成本D;若y=0表示继续此次拍卖,但是可能会被拒绝;x=0表示此轮竞拍失败,需要支付固定的拒绝成本R;x=1表示竞拍成功,p是用户的出价价格,v表示商品的价值,v-p表示此轮竞拍成功后用户能得到的回报;
多媒体服务器的资源利用率表示当前资源的使用情况,用α表示资源利用率;
因此,系统效用表示为U=Σi∈IΣm∈Mui,m+K(1-α);K为常数;
ui,m表示第i个用户对第m种沉浸式媒体业务类型的效用;
步骤三、针对当前沉浸式媒体资源,天地一体化网络的地面站节点接受所有用户的资源请求信息和出价信息,并将用户的出价进行降序排序;采用第二价格拍卖方式,决定拍卖成功的用户和拒绝的用户;
拍卖成功的用户数量与现有资源数量保持一致,需要支付的价格为出价第二高的价格;
步骤四、对拍卖成功的所有用户,采用基于Dijkstra算法及负载均衡的方式,将每个用户的请求信息分别发送给不同的多媒体服务器;
步骤五、每个多媒体服务器接收到用户请求信息后,释放与请求信息相应的资源,进而提供沉浸式媒体服务;并返回给地面站节点当前的资源利用率及任务执行结果。
2.如权利要求1所述的一种基于拍卖竞价的沉浸式媒体资源分配方法,其特征在于,所述天地一体化网络节点用图G=(V,E)表示,V表示卫星和地面站节点,E表示星间链路和星地链路;
所述每个多媒体服务器的容量大小相同,都存在M种沉浸式媒体业务类型,对于每个业务类型,共n个服务可用;服务类型包括低QoS和高QoS;不同的服务类型占有不同的资源单元。
3.如权利要求1所述的一种基于拍卖竞价的沉浸式媒体资源分配方法,其特征在于,所述I个用户的请求信息组成集合B={b1,b2,...,bi,...,bI};每个请求信息bi=(ti,ri,di)包含请求业务的类型ti,需要的资源单元ri及用户能忍受的最长时延di。
4.如权利要求1所述的一种基于拍卖竞价的沉浸式媒体资源分配方法,其特征在于,所述步骤二中,调整智能体策略的调整规则为:基于强化学习算法,采用Actor-Critic算法学习用户行为;具体过程为:
s301:定义智能体的状态空间为S(t)=[bi,Um,i(t-1),P(t-1),α],分别是第i个用户的请求信息bi,第i个用户上一个时刻对第m种沉浸式媒体业务类型的效用Um,i(t-1),上一个时刻的用户出价信息P(t-1),以及系统的资源利用率α;
其中,第i个用户对第m种沉浸式媒体业务类型的效用计算如下:
Um,i=ym,iCm,i+(1-ym,i)Dm,i
ym,i表示第i个用户是否撤回对第m种沉浸式媒体业务类型的竞拍;Dm,i表示当第i个用户撤回对第m种沉浸式媒体业务类型竞拍时,需要支付的撤回成本;Cm,i表示第i个用户对第m种沉浸式媒体业务类型参与竞拍的成本,计算如下:
Cm,i=xm,i(pm,i-vm,i)+(1-xm,i)Rm,i
pm,i表示第i个用户对第m种沉浸式媒体业务类型的出价价格,vm,i表示第m种沉浸式媒体业务类型的价值;Rm,i表示第i个用户对第m种沉浸式媒体业务类型的竞拍被拒绝的成本;
s302:设计智能体的行为空间A(t)=[pi(t),yi(t)],分别是第i个用户的出价pi(t)及是否撤回此轮拍卖yi(t);
s303:设计智能体的回报函数R(t)为最大化用户效用及资源利用率α:
S304:利用Actor-critic算法学习用户行为,并生成最优结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310351447.2/1.html,转载请声明来源钻瓜专利网。