[发明专利]确定视频类型的方法、装置、电子设备及可读存储介质在审
申请号: | 201911054391.4 | 申请日: | 2019-10-31 |
公开(公告)号: | CN112749299A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 李学海;冯鸳鹤 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06F40/289 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 邵淑双 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 视频 类型 方法 装置 电子设备 可读 存储 介质 | ||
本发明实施例提出的一种确定视频类型的方法、装置、电子设备及可读存储介质,获取与待分类视频对应的文本信息,对文本信息进行分词得到多个词语,确定每个词语在待分类视频中的播放时间,将得到的词语输入预设的文本分类模型,得到每个词语对应的类型,确定播放时间在目标时间段的目标词语,根据目标词语确定待分类视频在目标时间段的类型。本方案通过文本分类模型对待分类视频的词语进行分类,然后再根据词语的类型确定待分类视频在目标时间段的类型,通过本方案确定视频类型时,不再需要人工进行分类,节省时间和人力,而且本方案还可以根据词语对应的播放时间和类型对视频进行更加精细的分段分类。
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种确定视频类型的方法、装置、电子设备及可读存储介质。
背景技术
目前各大电影网站对于影视作品进行分类的时候,通常是通过人工观看电影后再做手动分类,当前这种进行影视作品分类的方法,效率较低。
上述对问题的发现过程的描述,仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明实施例提供了一种确定视频类型的方法、装置、电子设备及可读存储介质。
有鉴于此,第一方面,本发明实施例提供一种确定视频类型的方法,包括:
获取与待分类视频对应的文本信息;
对文本信息中的文本进行分词处理,得到多个词语;
确定每个词语在待分类视频中对应的播放时间;
将每个词语分别输入预设的文本分类模型,得到每个词语分别对应的类型;
确定播放时间在目标时间段内的词语,作为目标词语;
根据目标词语对应的类型,确定待分类视频在目标时间段的类型。
在一种可能的实现方式中,获取与待分类视频对应的文本信息,包括:
获取与待分类视频对应的字幕信息,得到相对应的文本信息;
或
提取待分类视频中的音频数据,从音频数据中提取文本信息。
在一种可能的实现方式中,提取待分类视频中的音频数据,从音频数据中提取文本信息,包括:
将待分类视频转换为音频数据;
对音频数据进行语音识别,得到与音频数据对应的文本信息。
在一种可能的实现方式中,将每个词语分别输入预设的文本分类模型之前,方法还包括:
获取语料信息,语料信息包括词语和类型;
利用语料信息对预设的神经网络模型进行训练,得到以词语为输入,类型为输出的文本分类模型。
在一种可能的实现方式中,根据目标词语对应的类型,确定待分类视频在目标时间段的类型,包括:
若目标词语的个数为一个,则确定目标词语对应的类型为待分类视频在目标时间段的类型;
若目标词语的个数为多个,则确定对应的目标词语个数最多的类型为待分类视频在目标时间段的类型。
在一种可能的实现方式中,方法还包括:
判断待分类视频在目标时间段的类型是否为目标类型;
若待分类视频在目标时间段的类型为目标类型,则将待分类视频存储至预设的与目标类型对应的视频库。
第二方面,本发明实施例还提供了一种确定视频类型的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911054391.4/2.html,转载请声明来源钻瓜专利网。