[发明专利]数据处理方法、装置、电子设备和存储介质有效
| 申请号: | 202110299802.7 | 申请日: | 2021-03-19 |
| 公开(公告)号: | CN113055751B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 张志立;许亚宾;张凯 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | H04N21/4788 | 分类号: | H04N21/4788;H04N21/435;H04N21/442 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 范芳茗 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种数据处理方法,包括:
获取直播间的视频在播放过程中产生的至少一个方面的互动数据,其中所述互动数据包括用户完整标识、用户精简标识、主播输出语音和主播输出消息;
基于所述至少一个方面中各个方面的互动数据,计算所述直播间在各个方面的互动量;
对所述直播间在预设时段内各个方面的互动量进行统计分析;
所述方法还包括:
通过语音识别将所述主播输出语音转化为语音识别文本;
根据所述主播输出消息生成消息文本;
所述基于所述至少一个方面中各个方面的互动数据,计算所述直播间在各个方面的互动量包括:
计算所述消息文本的数量和所述语音识别文本的数量之和,作为所述直播间在第四方面的互动量;
所述基于所述至少一个方面中各个方面的互动数据,计算所述直播间在各个方面的互动量还包括:
生成包含所述用户完整标识和所述用户精简标识的标识集合;
生成包含所述语音识别文本和所述消息文本的输出文本集合;
对所述标识集合和所述输出文本集合进行比对,确定所述文本集合中包含所述标识集合中的标识的目标文本;
计算所述目标文本的数量,作为所述直播间在第一方面的互动量。
2.根据权利要求1所述的方法,还包括:
基于所述直播间在至少一个方面的互动量,确定所述直播间的视频的播出方式。
3.根据权利要求2所述的方法,其中,所述基于所述直播间在至少一个方面的互动量,确定所述直播间的视频的播出方式包括:
在确定所述直播间在至少一个方面的互动量大于第一预设阈值的情况下,确定所述直播间的视频的播出方式为直播;
在确定所述直播间在至少一个方面的互动量小于第二预设阈值的情况下,确定所述直播间的视频的播出方式为录播。
4.根据权利要求1所述的方法,其中,所述生成包含用户完整标识和精简标识的标识集合包括:
提取所述用户的完整标识;
从提取的完整标识中去除预设符号,得到用户的精简标识;
根据所述用户的完整标识和精简标识,生成所述标识集合。
5.根据权利要求1所述的方法,其中,所述至少一个方面的互动数据包括访问所述直播间的用户的评价文本,所述基于所述至少一个方面中各个方面的互动数据,计算所述直播间在各个方面的互动量包括:
使用自然语言处理模型对所述评价文本进行语义分析,得到用户具有的至少一个评价特征,每个评价特征用于表征用户的情感、观点和偏好中的之一;
计算具有各个评价特征的用户的数量,作为所述直播间在第二方面的互动量。
6.根据权利要求1所述的方法,其中,所述至少一个方面的互动数据包括访问所述直播间的用户发放礼物产生的操作记录,所述基于所述至少一个方面中各个方面的互动数据,计算所述直播间在各个方面的互动量包括:
计算所述操作记录的数量,作为所述直播间在第三方面的互动量。
7.根据权利要求1所述的方法,其中,所述至少一个方面的互动数据包括所述直播间的主播连接其他直播间的主播产生的连接记录,所述基于所述至少一个方面中各个方面的互动数据,计算所述直播间在各个方面的互动量包括:
计算所述连接记录的数量,作为所述直播间在第五方面的互动量。
8.根据权利要求1所述的方法,其中,所述对所述直播间在预设时段内各个方面的互动量进行统计分析包括:
基于所述直播间在预设时段内各个方面的互动量,生成互动量分析图,所述互动量分析图用于表征所述互动量在所述预设时段内的变化趋势。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110299802.7/1.html,转载请声明来源钻瓜专利网。





