[发明专利]面向智能节目制作的训练数据生成方法及装置有效
| 申请号: | 201811251494.5 | 申请日: | 2018-10-25 |
| 公开(公告)号: | CN111105817B | 公开(公告)日: | 2021-08-17 |
| 发明(设计)人: | 薛子育;郭沛宇;王磊 | 申请(专利权)人: | 国家广播电视总局广播电视科学研究院 |
| 主分类号: | G11B27/031 | 分类号: | G11B27/031;G11B27/34 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 闫雪薇;马佑平 |
| 地址: | 100866 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 智能 节目 制作 训练 数据 生成 方法 装置 | ||
本发明公开了一种面向智能节目制作的训练数据集生成方法及装置。该方法包括:根据节目内容,获取节目内容片段;根据节目编目信息,获取节目语义片段;从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;输出所述训练数据集。根据本发明实施例,可以快速生成用于智能化节目制作模型的训练数据集,节省了大量的人工成本和时间,提高了训练数据集的生成效率。
技术领域
本发明涉及多媒体服务技术领域,更具体地,涉及一种面向智能节目制作的训练数据生成方法及装置。
背景技术
当前,云计算、大数据等技术的发展推动了广播电视媒体融合进程,电台电视台等技术系统IP化,云平台化,提升了生产效率,生产出海量的视音频节目素材,创新出多种多样的媒体无副模式,推动了广播电视行业转型升级,也为人工智能向广播电视行业的渗透提供基础支撑。
目前,可以基于人工智能等技术,实现充分利用海量的节目素材快速、高效的制作出高质量的广播电视节目的目的。但基于人工智能的节目智能化制作方法需要标注大量的训练数据用于节目智能化制作模型的训练、验证与测试,这些数据的标注往往需要人工耗费大量的时间来实现。
因此,发明人认为,有必要对上述现有技术中存在的至少一个问题进行改进。
发明内容
本发明的一个目的是提供一种面向智能节目制作的训练数据生成的新技术方案。
根据本发明的第一方面,提供了一种面向智能节目制作的训练数据集生成方法,所述方法包括:
根据节目内容,获取节目内容片段;
根据节目编目信息,获取节目语义片段;
从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;
按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;
输出所述训练数据集。
可选的,所述根据节目内容,获取节目内容片段的步骤,包括:
将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
可选的,所述根据节目编目信息,获取节目语义片段的步骤,包括:
将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
可选的,所述从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息的步骤,包括:
向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;
接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
可选的,所述按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集的步骤,包括:
将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;
将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;
根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
根据本发明的第二方面,提供了一种面向智能节目制作的训练数据集生成装置,所述装置包括:
节目内容分割模块,用于根据节目内容,获取节目内容片段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家广播电视总局广播电视科学研究院,未经国家广播电视总局广播电视科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811251494.5/2.html,转载请声明来源钻瓜专利网。





