[发明专利]一种面向模糊文本挖掘的新闻视频主题分割方法有效

专利信息
申请号: 201910062048.8 申请日: 2019-01-23
公开(公告)号: CN109902289B 公开(公告)日: 2022-12-13
发明(设计)人: 姜大志;黄志均;曾文信;黄瑞香;漆原 申请(专利权)人: 汕头大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06F40/279;G10L13/02;G10L13/08;G10L15/04;G10L15/26
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 周增元;曹江
地址: 515000 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 模糊 文本 挖掘 新闻 视频 主题 分割 方法
【说明书】:

本发明实施例公开了一种面向模糊文本挖掘的新闻视频主题分割方法,包括步骤:将新闻视频转换成音频,使用语音识别技术将音频转换成模糊文本;使用语音识别技术将音频转换成模糊文本;文本的分词;文本的表示;分析音频信息,找出静音点作为潜在分割点;对模糊文本进行分割点识别,更新潜在分割点;把词性分析后筛选出的词语序列,用语言模型转换成句子向量,并根据句子向量的相似度分布来更新潜在分割点;基于PSO确定TextTiling算法参数进行文本主题分割。采用本发明,把视频信息以故事为单位进行语义分割从而形成独立的语义单元,可应用于众多视频检索的应用领域,如影视、监控、交通视频等。

技术领域

本发明涉及人工智能领域,尤其涉及一种面向模糊文本挖掘的新闻视频主题分割方法。

背景技术

随着互联网、电子信息以及通信技术的飞速发展,各个行业与领域均积累了海量的数据,但是数据量的急剧增大给有效的信息检索带来了极大的挑战。新闻视频是多媒体传播信息的一种重要的途径,其中的视频信息中包含了丰富和生动的语义信息,但由于新闻视频一般缺乏良好的结构组织以及索引,获取某一方面的新闻需要全篇浏览视频,无法对过往的视频进行检索。如果需要查询某一个主题的新闻视频,则要重新浏览新闻视频,这对于人力、物力以及时间方面都是一个极大的消耗。而通过对视频的检索,可以快速的获取对应的信息,减少阅读和查找的时间,提高搜索效率,因此如何实现高效的新闻视频搜索已经成为了一个研究的热点。

目前,可知的研究中对新闻视频主题分割方面的研究和发明有了一段的积累。新闻视频的主题分割技术从信息类型上主要有3种,分别是基于视频镜头的主题分割、基于声学特征的主题分割和基于文本信息的主题分割。

新加坡的L Chaisorn在《A Hierarchical Multi-Modal approach to storysegmentation in news video》(新闻视频中故事分割的分层多模态方法)论文中提出的故事分割方法,将镜头分成十三个类别,根据类别确定故事边界,以达到新闻视频主题分割的目的。

刘华咏在《基于音视频特征和文字信息自动分段新闻故事》论文中通过静音检测和字幕检测来实现新闻主题分割。

余骁捷等人在《新闻播报节目的内容自动标注系统》中通过语音识别技术实现了基于语义的主题分割模型。

凌坚等人在论文《新闻单元的自动快速分割方法》以及刘群等人在论文《采用多特征融合的镜头边界检测方法》中,根据图片的颜色分布情况及其特征,分析出视频中的说话人和说话人所处的环境变化,进而对视频中的场景进行分类,实现了新闻视频的基于图像之间相邻帧的相似度变化的主题分割。

对于上述新闻视频主题分割技术出现的调节效果不理想的问题,可能是多方面的影响,如设备、算法、实现模式、作用模式等。

从Hearst在《Segmenting Text Into Multi-Paragraph Subtopic Passages》论文中提出TextTiling算法,利用文本块之间的差异性来实现文本主题的分割。由此我们可以得出文本信息和新闻视频主题两者之间的相互关联。因而我们可以通过设计两者之间的关系模型实现基于基于模糊文本挖掘的新闻视频主题分割技术。

其中,对于文本主题分割的实现,目前国内已有大量的研究和专利,并且方案均比较成熟。例如,钟彬彬等人在论文《基于GA的文本子主题切分中的参数优化研究》中提出了用遗传算法来优化TextTiling算法中的参数的主题分割方法,在中文文本中的主题分割模型中取得了较好的效果。

由以上可知,目前对于“新闻视频的主题分割”问题在技术手段上已经有了较大的突破。

上述现有技术中存在有以下缺陷:

1、基于语音分析的新闻视频分割技术,无法对同一主持人播报不同新闻的情况进行很好的主题变化的切割。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汕头大学,未经汕头大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910062048.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top