[发明专利]用于确定新闻的视频素材的方法和装置有效
| 申请号: | 202010090126.8 | 申请日: | 2020-02-13 |
| 公开(公告)号: | CN112188312B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 卢大明;田浩 | 申请(专利权)人: | 百度(美国)有限责任公司 |
| 主分类号: | H04N21/85 | 分类号: | H04N21/85;H04N21/8549;G06F40/284 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 确定 新闻 视频 素材 方法 装置 | ||
本公开公开了用于确定新闻的视频素材的方法和装置。该用于确定新闻的视频素材的方法包括:获取新闻文本在多个维度的关键词的评分的加权分值;基于关键词的评分的加权分值,筛选新闻的关键词集合;采用新闻的关键词集合,搜索预选视频;基于预选视频,确定新闻的视频素材。本公开提高了新闻的视频素材与新闻文本的相符程度。
相关申请的交叉引用
本申请要求申请日为2019年7月2日,申请号为16/460,301,发明名称为“MethodAnd Apparatus For Determining(Raw)Video Materials For News”的美国专利申请的优先权。
技术领域
本公开涉及媒体技术领域,具体新闻媒体领域,尤其涉及用于确定新闻的视频素材的方法和装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
在制作新闻时,针对新闻文本,需要提供匹配新闻文本的视频素材。目前,主要经由人工查找与新闻文本匹配的新闻的视频素材。具体是:针对需要配视频的新闻文本(包括新闻全文和/或新闻全文中的摘要段落),人工浏览视频内容,人工根据新闻文本的内容选择视频的视频素材来完成新闻的制作。
发明内容
本公开的实施例提供了用于确定新闻的视频素材的方法和装置。
第一方面,本公开的实施例提供了用于确定新闻的视频素材的方法,包括:获取新闻文本在多个维度的关键词的评分的加权分值;其中,新闻文本在多个维度的关键词的评分包括:基于切分新闻文本所得的词与新闻标题的关联度确定的关键词的评分;基于关键词的评分的加权分值,筛选新闻的关键词集合;采用新闻的关键词集合,搜索预选视频;基于预选视频,确定新闻的视频素材。
在一些实施例中,获取新闻文本在多个维度的关键词的评分的加权分值包括以下至少一项:采用提取关键词的注意力模型获取新闻文本的关键词的评分,包括:采用提取关键词的注意力模型获取基于切分新闻文本所得的词与新闻标题的关联度确定的关键词的评分;采用TF-IDF获取新闻文本的关键词的评分;采用不同粒度的领域词典获取新闻文本的关键词的评分。
在一些实施例中,采用提取关键词的注意力模型获取新闻文本的关键词的评分包括:获取采用以下至少一类分词工具对新闻文本进行分词所得到的词的评分:基于所得到的词的长度评分的分词工具;基于所得到的词与新闻标题的关联度评分的分词工具;以及基于注意力机制对切分新闻文本所得的词评分的分词工具;获取对应所得到的词的评分的权重;将所得到的词的评分与对应所得到的词的评分的权重的乘积,作为新闻文本的关键词的评分。
在一些实施例中,获取对应所得到的词的评分的权重包括:采用第一权重分配模型获取对应所得到的词的评分的权重;其中,第一权重分配模型被配置成:基于新闻文本采用各类分词工具分词所得到的词的评分,预测对应所得到的词的评分的权重。
在一些实施例中,获取新闻文本在多个维度的关键词的评分的加权分值包括:采用第二权重分配模型获取与获取的关键词的评分相对应的关键词权重;其中,第二权重分配模型被配置成:基于多个维度中新闻文本的关键词的评分,预测与获取的关键词的评分相对应的关键词权重。
在一些实施例中,基于预选视频,确定新闻的视频素材包括:获取针对预选视频的视频描述信息集合,视频描述信息集合包括:对预选视频的元信息进行命名实体识别得到的识别结果;和/或预选视频的标签;将视频描述信息集合中包括新闻的关键词集合的视频确定为新闻的视频素材。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010090126.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于确定新闻的视频素材的方法和装置
- 下一篇:信息处理装置和半导体装置





