[发明专利]一种检测自媒体音视频内容中的违规信息的方法在审

专利信息
申请号: 201710682539.3 申请日: 2017-08-10
公开(公告)号: CN107295401A 公开(公告)日: 2017-10-24
发明(设计)人: 李强;王凤琴 申请(专利权)人: 四川长虹电器股份有限公司
主分类号: H04N21/44 分类号: H04N21/44;H04N21/439;H04N21/435;G10L15/26;G10L25/51
代理公司: 四川省成都市天策商标专利事务所51213 代理人: 刘兴亮,刘渝
地址: 621000 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 检测 媒体 视频 内容 中的 违规 信息 方法
【说明书】:

技术领域

发明涉及数字电视技术领域,具体涉及一种检测自媒体音视频内容中的违规信息的方法。

背景技术

自媒体是近几年产生的新生事物,自媒体又称“公民媒体”或“个人媒体”,是指私人化、平民化、普泛化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称。目前的自媒体平台有很多,包括各种博客平台、微博、微信、贴吧、短视频平台、直播平台等网络社区。

由于自媒体来自于广大人民群众自行制作的内容,一些人在制作自媒体的同时,出于某些别有用心的动机,往往会在自媒体内容中加入不符合广电总局要求的文字或音频内容信息。而对于各个自媒体平台而言,通过人工审核用户上传的自媒体信息,往往工作量较大,尤其是对于用户基数庞大的自媒体平台而言,人工审核的工作量非常大。

有鉴于此,我们设计并实现了一种检测自媒体音视频内容中的违规信息的方法,可以利用计算机的计算能力,智能地解决检测自媒体音视频内容中的违规信息的工作,节省了大量人力劳动,并有利于净化网络环境。

发明内容

本发明克服了现有技术的不足,提供了一种检测自媒体音视频内容中的违规信息的方法。

为解决上述的技术问题,本发明以下技术方案:

一种检测自媒体音视频内容中的违规信息的方法,包括如下步骤:

步骤一、检测用户上传的自媒体文件使用的格式和编码;

步骤二、扫描字幕文件的内容,查看是否存在敏感词汇;

对字幕文件的内容进行全文扫描,查看内容中是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤九;如果不存在敏感词汇,继续下一步骤;

步骤三、调用音视频解码器对自媒体进行解码,输出相应的数据流;

步骤四、对数据流进行实时检测,检测是否存在异常声音的音频时间点;

步骤五、从步骤四的音频时间点开始截取一段时间的音频内容,并生成一个音频文件,并进行临时存储;

步骤六、对音频文件进行语音识别,转为相应的文字信息;

步骤七、对文字信息进行检查,看是否存在敏感词汇;如果存在敏感词汇,检测结束,返回检测的结果,即步骤九;如果不存在敏感词汇,继续步骤八;

步骤八、返回自媒体内容合法的结果;表示自媒体内容已经通过平台机器人的智能审查,初审通过;

步骤九、返回检测结果;此步骤为返回检测到违规内容的结果。

更进一步的方案是:

步骤一中,检测是指以数据流的方式,读取用户上传的自媒体文件的内容,并根据各种视频、音频、字幕的格式标准定义进行比对,获得用户上传的自媒体文件使用的格式和编码。

更进一步的方案是:

步骤二所述敏感词汇的判定来源于预先构建的敏感词库,且这个敏感词库能够根据国家和广电总局的要求实时更新和扩展。

更进一步的方案是:

步骤三中,解码,是根据检测获得的自媒体格式和编码,调用相应的音视频解码器,对自媒体的内容进行解码,输出相应的数据流。

更进一步的方案是:

步骤四中,检测是否存在异常声音,是实时检测音频的采样频率,找出变化的音频的时间点;

或者实时检测声音的频谱,找出频谱突发性显著变化的音频的时间点。

更进一步的方案是:

步骤五中,音频文件的编码格式为MP3、WAV、OGG、PCM编码格式,音频采样率不低于44.1KHz。

更进一步的方案是:

步骤五中,临时存储的音频临时文件的文件名的编码规则,是以下字段的组合,包括:节目内容名、编码顺序号、时间长度、随机数的字段信息。

更进一步的方案是:

步骤六中,是通过语音识别引擎对音频文件的语音内容进行识别,以此获得语音内容的文字信息。

更进一步的方案是:

语音识别引擎可以是厂家自建的语音识别服务,也可以调用开放的第三方的语音识别引擎API来实现,比如科大讯飞的语音识别开放平台、微软的语音识别引擎服务等等。

本发明可以利用计算机的计算能力,智能地解决检测自媒体音视频内容中的违规信息的工作,节省了大量人力劳动,并有利于净化网络环境。

附图说明

图1是一种检测自媒体音视频内容中的违规信息方法的流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明做进一步地详细描述。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710682539.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top