[发明专利]确定视频类型的方法、装置、电子设备及可读存储介质在审
| 申请号: | 201911054391.4 | 申请日: | 2019-10-31 |
| 公开(公告)号: | CN112749299A | 公开(公告)日: | 2021-05-04 |
| 发明(设计)人: | 李学海;冯鸳鹤 | 申请(专利权)人: | 北京国双科技有限公司 |
| 主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06F40/289 |
| 代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 邵淑双 |
| 地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 确定 视频 类型 方法 装置 电子设备 可读 存储 介质 | ||
1.一种确定视频类型的方法,其特征在于,包括:
获取与待分类视频对应的文本信息;
对所述文本信息中的文本进行分词处理,得到多个词语;
确定每个所述词语在所述待分类视频中对应的播放时间;
将每个所述词语分别输入预设的文本分类模型,得到每个所述词语分别对应的类型;
确定播放时间在目标时间段内的词语,作为目标词语;
根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型。
2.根据权利要求1所述的方法,其特征在于,获取与待分类视频对应的文本信息,包括:
获取与所述待分类视频对应的字幕信息,得到相对应的文本信息;
或
提取所述待分类视频中的音频数据,从所述音频数据中提取文本信息。
3.根据权利要求2所述的方法,其特征在于,提取所述待分类视频中的音频数据,从所述音频数据中提取文本信息,包括:
将所述待分类视频转换为音频数据;
对所述音频数据进行语音识别,得到与所述音频数据对应的文本信息。
4.根据权利要求1所述的方法,其特征在于,将每个所述词语分别输入预设的文本分类模型之前,所述方法还包括:
获取语料信息,所述语料信息包括词语和类型;
利用所述语料信息对预设的神经网络模型进行训练,得到以词语为输入,类型为输出的文本分类模型。
5.根据权利要求1所述的方法,其特征在于,根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型,包括:
若所述目标词语的个数为一个,则确定所述目标词语对应的类型为所述待分类视频在所述目标时间段的类型;
若所述目标词语的个数为多个,则确定对应的目标词语个数最多的类型为所述待分类视频在所述目标时间段的类型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述待分类视频在所述目标时间段的类型是否为目标类型;
若所述待分类视频在所述目标时间段的类型为所述目标类型,则将所述待分类视频存储至预设的与所述目标类型对应的视频库。
7.一种确定视频类型的装置,其特征在于,包括:
获取模块,用于获取与待分类视频对应的文本信息;
分词模块,用于对所述文本信息中的文本进行分词处理,得到多个词语;
播放时间确定模块,用于确定每个所述词语在所述待分类视频中对应的播放时间;
第一类型确定模块,用于将每个所述词语分别输入预设的文本分类模型,得到每个所述词语分别对应的类型;
目标词语确定模块,用于确定播放时间在目标时间段内的词语,作为目标词语;
第二类型确定模块,用于根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型。
8.根据权利要求7所述的装置,其特征在于,所述第二类型确定模块根据所述目标词语对应的类型,确定所述待分类视频在所述目标时间段的类型,包括:
若所述目标词语的个数为一个,则确定所述目标词语对应的类型为所述待分类视频在所述目标时间段的类型,若所述目标词语的个数为多个,则确定对应的目标词语个数最多的类型为所述待分类视频在所述目标时间段的类型。
9.一种电子设备,其特征在于,包括:至少一个处理器、以及与处理器连接的至少一个存储器、总线,其中,处理器、存储器通过总线完成相互间的通信,处理器用于调用存储器中的程序指令,以执行权利要求1-6任一所述确定视频类型的方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质存储计算机指令,所述计算机指令使计算机执行权利要求1-6任一所述确定视频类型的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911054391.4/1.html,转载请声明来源钻瓜专利网。





