[发明专利]用于确定新闻的视频素材的方法和装置有效
| 申请号: | 202010090126.8 | 申请日: | 2020-02-13 |
| 公开(公告)号: | CN112188312B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 卢大明;田浩 | 申请(专利权)人: | 百度(美国)有限责任公司 |
| 主分类号: | H04N21/85 | 分类号: | H04N21/85;H04N21/8549;G06F40/284 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 确定 新闻 视频 素材 方法 装置 | ||
1.一种用于确定新闻的视频素材的方法,包括:
获取新闻文本在多个维度的关键词的评分的加权分值;其中,所述新闻文本在多个维度的关键词的评分包括:基于切分所述新闻文本所得的词与新闻标题的关联度确定的关键词的评分;
基于所述关键词的评分的加权分值,筛选新闻的关键词集合;
采用所述新闻的关键词集合,搜索预选视频;
基于所述预选视频,确定新闻的视频素材。
2.根据权利要求1所述的方法,其中,所述获取新闻文本在多个维度的关键词的评分的加权分值包括以下至少一项:
采用提取关键词的注意力模型获取新闻文本的关键词的评分,包括:采用提取关键词的注意力模型获取所述基于切分所述新闻文本所得的词与新闻标题的关联度确定的关键词的评分;
采用TF-IDF获取新闻文本的关键词的评分;
采用不同粒度的领域词典获取新闻文本的关键词的评分。
3.根据权利要求2所述的方法,其中,所述采用提取关键词的注意力模型获取新闻文本的关键词的评分包括:
获取采用以下至少一类分词工具对新闻文本进行分词所得到的词的评分:基于所得到的词的长度评分的分词工具;基于所得到的词与所述新闻标题的关联度评分的分词工具;以及基于注意力机制对切分所述新闻文本所得的词评分的分词工具;
获取对应所述所得到的词的评分的权重;
将所述所得到的词的评分与对应所述所得到的词的评分的权重的乘积,作为新闻文本的关键词的评分。
4.根据权利要求3所述的方法,其中,所述获取对应所述所得到的词的评分的权重包括:
采用第一权重分配模型获取对应所述所得到的词的评分的权重;其中,第一权重分配模型被配置成:基于新闻文本采用各类分词工具分词所得到的词的评分,预测对应所述所得到的词的评分的权重。
5.根据权利要求1所述的方法,其中,所述获取新闻文本在多个维度的关键词的评分的加权分值包括:
采用第二权重分配模型获取与获取的关键词的评分相对应的关键词权重;其中,第二权重分配模型被配置成:基于多个维度中新闻文本的关键词的评分,预测与获取的所述关键词的评分相对应的关键词权重。
6.根据权利要求1所述的方法,其中,所述基于所述预选视频,确定新闻的视频素材包括:
获取针对所述预选视频的视频描述信息集合,所述视频描述信息集合包括:对所述预选视频的元信息进行命名实体识别得到的识别结果;和/或所述预选视频的标签;
将所述视频描述信息集合中包括所述新闻的关键词集合的视频确定为新闻的视频素材。
7.根据权利要求1所述的方法,其中,所述方法还包括:
识别所述新闻文本中的人物名;
基于所述人物名搜索视频,得到待选视频;
抽取所述待选视频中的关键帧;
识别所述关键帧中的人脸,得到所述人脸的身份信息;
响应于所述人脸的身份信息与所述人物名相符,将待选视频确定为所述新闻的视频素材。
8.根据权利要求1所述的方法,其中,所述方法还包括:
响应于所述新闻的视频素材的播放时长超过新闻所需的播放时长,基于所述新闻的视频素材中场景发生变化的视频帧,切分所述新闻的视频素材;
采用切分后的视频素材更新所述新闻的视频素材。
9.根据权利要求1所述的方法,其中,所述方法还包括:
在播报所述新闻文本时,播放所述新闻的视频素材。
10.根据权利要求1所述的方法,其中,所述新闻文本包括:新闻全文和/或新闻全文中的摘要段落。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010090126.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于确定新闻的视频素材的方法和装置
- 下一篇:信息处理装置和半导体装置





