[发明专利]直播互动方法、装置、电子设备及可读存储介质有效
| 申请号: | 201910368510.7 | 申请日: | 2019-05-05 |
| 公开(公告)号: | CN110085244B | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 徐子豪;刘炉 | 申请(专利权)人: | 广州虎牙信息科技有限公司 |
| 主分类号: | G10L21/013 | 分类号: | G10L21/013;H04L29/06 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 杨奇松 |
| 地址: | 511400 广东省广州市番禺区南村镇万博二*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本申请实施例提供一种直播互动方法、装置、电子设备及可读存储介质,通过从主播输入的第一音频数据中提取内容特征图并通过预设的特征向量提取网络提取内容特征向量,而后采用目标音色风格对应的风格转换模型对内容特征向量进行转换,得到具有目标音色风格的风格转换图。接着对内容特征图和风格转换图进行特征反转换,得到具有该目标音色风格的第二音频数据。最后,根据第二音频数据生成该主播对应的虚拟形象的互动视频流,并发送给客户端进行播放。如此,能够针对任意主播,在不改变音频内容的同时,将虚拟形象直播过程中的音色风格转换为目标音色风格以与观众进行互动,进而提高直播过程中的互动效果,更大程度上地调动观众与主播的互动。 | ||
| 搜索关键词: | 直播 互动 方法 装置 电子设备 可读 存储 介质 | ||
【主权项】:
1.一种直播互动方法,其特征在于,应用于主播端,所述主播端中存储有至少一种风格转换模型,每种风格转换模型与一种音色风格相对应,所述方法包括:根据接收到的音色转换请求,从主播输入的第一音频数据中提取音频特征图,所述音频特征图包括内容特征图,所述音色转换请求包括目标音色风格;将所述内容特征图输入到预设的特征向量提取网络,提取所述内容特征图的内容特征向量;采用所述目标音色风格对应的风格转换模型对所述内容特征向量进行转换,得到具有所述目标音色风格的风格转换图;对所述内容特征图和所述风格转换图进行特征反转换,得到具有该目标音色风格的第二音频数据;根据所述第二音频数据生成该主播对应的虚拟形象的互动视频流,并发送给客户端进行播放。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙信息科技有限公司,未经广州虎牙信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910368510.7/,转载请声明来源钻瓜专利网。





