[发明专利]多媒体数据处理方法、装置、电子设备及可读存储介质在审
申请号: | 202210554099.4 | 申请日: | 2022-05-19 |
公开(公告)号: | CN115080770A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 唐鑫;王冠皓 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/40 | 分类号: | G06F16/40;G06F40/30;G06V10/764;G06V10/82 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 数据处理 方法 装置 电子设备 可读 存储 介质 | ||
本公开提供了一种多媒体数据处理方法、装置、电子设备及可读存储介质,涉及数据处理技术领域和图像处理技术领域,尤其涉及深度学习、语音技术等人工智能技术领域。具体实现方案为:获取待处理的多媒体数据的至少两个模态数据;所述至少两个模态数据包括文本模态数据、音频模态数据和图像模态数据中的至少两个;对所述至少两个模态数据进行切分处理,以获得所述至少两个模态数据的数据片段;对所述至少两个模态数据的数据片段进行融合处理,以获得所述多媒体数据的至少两个多媒体片段。
技术领域
本公开涉及数据处理技术领域和图像处理技术领域,尤其涉及深度学 习、语音技术等人工智能技术领域。
背景技术
随着科技的快速发展,在多媒体数据的分类、存储、搜索、推荐等应 用场景中,多媒体数据的内容切分十分重要。
通常,操作人员需要自己完整的看完多媒体数据,然后,根据多媒体 数据的内容进行手动切分。
发明内容
本公开提供了一种多媒体数据处理方法、装置、电子设备及可读存储 介质。
根据本公开的一方面,提供了一种多媒体数据处理方法,包括:
获取待处理的多媒体数据的至少两个模态数据;所述至少两个模态数 据包括文本模态数据、音频模态数据和图像模态数据中的至少两个;
对所述至少两个模态数据进行切分处理,以获得所述至少两个模态数 据的数据片段;
对所述至少两个模态数据的数据片段进行融合处理,以获得所述多媒 体数据的至少两个多媒体片段。
根据本公开的另一方面,提供了一种多媒体数据处理装置,包括:
获取单元,用于获取待处理的多媒体数据的至少两个模态数据;所述 至少两个模态数据包括文本模态数据、音频模态数据和图像模态数据中的 至少两个;
分段单元,用于对所述至少两个模态数据进行切分处理,以获得所述 至少两个模态数据的数据片段;
融合单元,用于对所述至少两个模态数据的数据片段进行融合处理, 以获得所述多媒体数据的至少两个多媒体片段。
根据本公开的再一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被 所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的 方面和任一可能的实现方式的方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算 机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面 和任一可能的实现方式的方法。
根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程 序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的 实现方式的方法。
由上述技术方案可知,本公开实施例通过融合了多媒体数据的多个模 态数据,使得能够从多个角度分析出多媒体数据的内容,进而实现对多媒 体数据的正确切分,从而提高了多媒体数据切分的效率和可靠性。
另外,采用本公开所提供的技术方案,能够有效地提高用户的体验。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键 或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下 的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210554099.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种野战光缆的修复方法
- 下一篇:一种带有监测功能的纸巾生产用原料输送装置