[发明专利]一种短视频类别预测方法、系统、电子设备及存储介质在审
| 申请号: | 202011167164.5 | 申请日: | 2020-10-27 |
| 公开(公告)号: | CN113762571A | 公开(公告)日: | 2021-12-07 |
| 发明(设计)人: | 张金晖 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/75;G06N3/04;G06N3/08 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
| 地址: | 100086 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 类别 预测 方法 系统 电子设备 存储 介质 | ||
本公开提供了一种短视频类别预测方法,包括:获取同一短视频内的多条弹幕;将所述弹幕按时间顺序排列生成弹幕内容序列;将所述弹幕内容序列输入预设的LSTM网络中,利用所述LSTM网络输出所述弹幕内容序列的内容特征向量;根据所述内容特征向量,预测所述短视频的类别。
技术领域
本公开涉及互联网技术领域,更具体地,涉及一种短视频类别预测方法、系统、电子设备及计算机存储介质。
背景技术
随着互联网智能时代的开启,互联网用户获取资讯的方式越来越多样化,其中,短视频凭借其占用内存小、内容种类繁杂、制作形式多样灵活等特点,短视频成为了用户获取资讯的一个重要途径。因此,对短视频的内容基本审查就显得非常必要。
目前,对短视频进行内容审查的方式主要包括人工审查,由于人工审查的效率低下,需要寻求更加有效的方式提升对短视频的审查效率。
发明内容
有鉴于此,本公开提供了一种短视频类别预测方法、系统、计算机系统及计算机存储介质。
本公开的一个方面提供了一种短视频类别预测方法,包括:获取同一短视频内的多条弹幕;将所述弹幕按时间顺序排列生成弹幕内容序列;将所述弹幕内容序列输入预设的LSTM网络中,利用所述LSTM网络获取所述弹幕内容序列的内容特征;根据所述内容特征,预测所述短视频的类别。
根据本公开的实施例,还包括:在获取所述短视频内的多条弹幕后,去除内容重复的弹幕,保留所述内容重复的弹幕中出现时间最早的弹幕。
根据本公开的实施例,其中,所述将所述弹幕内容序列输入预设的LSTM网络中,利用所述LSTM网络得到所述弹幕内容序列的内容特征包括:利用所述LSTM网络获取所述弹幕内容序列包含的各条弹幕的弹幕特征;利用所述LSTM网络对各所述弹幕特征进行特征学习,获得所述弹幕内容序列的内容特征。
根据本公开的实施例,其中,所述利用所述LSTM网络获取所述弹幕内容序列包含的各条弹幕的弹幕特征包括:依次读取所述弹幕内容序列中的各条弹幕;对所述弹幕中包含的字和各个所述字在所述弹幕中的位置进行嵌入化处理,得到各个所述字的字向量;基于各个所述字的字向量进行特征学习,获得各所述字的字特征向量;将各所述字的字特征向量进行聚焦,获得所述弹幕的弹幕特征向量,所述弹幕特征向量表示所述弹幕特征。
根据本公开的实施例,其中,所述利用所述LSTM网络对各所述弹幕特征进行特征学习,获得所述弹幕内容序列的内容特征包括:将各所述弹幕的弹幕特征及各所述弹幕的位置进行嵌入化处理,得到各所述弹幕的特征输入向量;基于各所述弹幕的特征输入向量进行特征学习,获得各所述弹幕的语义特征向量;将各所述语义特征向量进行聚焦,获得所述弹幕内容序列的内容特征向量,所述内容特征向量表示所述弹幕内容。
根据本公开的实施例,其中,所述LSTM网络通过预设的多种类别的短视频包含的多条弹幕训练得到。
根据本公开的实施例,获取所述内容特征向量后,将所述内容特征向量进行矩阵变换,使所述内容特征向量映射到预设的短视频类别编码上,根据所述短视频类别编码,预测所述短视频的类别。
本公开另一方面提供了一种短视频类别预测系统,包括:弹幕获取模块,用于获取同一短视频内的多条弹幕;排序模块,用于将所述弹幕按时间顺序排列生成弹幕内容序列;内容特征提取模块,用于将所述弹幕内容序列输入预设的LSTM网络中,利用所述LSTM网络获取所述弹幕内容序列的内容特征;类别预测模块,用于根据所述内容特征,预测所述短视频的类别。
根据本公开的实施例,还包括:弹幕去重模块,用于在获取所述短视频内的多条弹幕后,去除内容重复的弹幕,保留所述内容重复的弹幕中出现时间最早的弹幕。
根据本公开的实施例,其中,所述内容特征提取模块包括:弹幕特征获取单元,用于利用所述LSTM网络获取所述弹幕内容序列包含的各条弹幕的弹幕特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011167164.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种货物存取装置及仓储系统
- 下一篇:测试方法、系统、计算机系统和介质
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





