[发明专利]互联网上多媒体信息识别方法、装置及电子设备在审

申请号：	202211313755.8	申请日：	2022-10-25
公开（公告）号：	CN115720242A	公开（公告）日：	2023-02-28
发明（设计）人：	叶明;张琦	申请（专利权）人：	武汉虹旭信息技术有限责任公司
主分类号：	H04L69/06	分类号：	H04L69/06;G06F18/22;G06F18/10
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	张睿
地址：	430074 湖北省武汉市***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	互联网多媒体信息识别方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种互联网上多媒体信息识别方法、装置及电子设备，该方法包括：对互联网数据进行采集，获取待识别数据集；对所述待识别数据集进行数据预处理，得到预处理数据集；根据多媒体规律规则库对所述预处理数据集进行多媒体信息识别，所述多媒体规律规则库包括多媒体魔术字节库、多媒体内容类型Content‑Type对应关系库和多媒体后缀名对应关系库。通过对互联网上的数据进行采集和预处理，并利用多媒体规律规则库对预处理数据集进行多媒体信息识别，可以有效从互联网数据中识别出隐蔽的多媒体信息。

技术领域

本发明涉及流量识别技术领域，尤其涉及一种互联网上多媒体信息识别方法、装置及电子设备。

背景技术

多媒体技术是目前信息技术领域发展最快、应用最广、变化最快的技术。随着5G网络的普及，互联网中多媒体数据急剧增加。同时，多媒体数据具有更强的隐蔽性。

为了对互联网中的多媒体数据进行有效监测，首先需要从海量互联网数据中识别出多媒体数据。所以，如何提出一种有效的互联网上多媒体信息识别方案，能够便于从海量互联网数据中识别出多媒体数据，是业界亟需解决的重要课题。

发明内容

针对现有技术存在的问题，本发明提供一种互联网上多媒体信息识别方法、装置及电子设备。

第一方面，本发明提供一种互联网上多媒体信息识别方法，包括：

对互联网数据进行采集，获取待识别数据集；

对所述待识别数据集进行数据预处理，得到预处理数据集；

根据多媒体规律规则库对所述预处理数据集进行多媒体信息识别，所述多媒体规律规则库包括多媒体魔术字节库、多媒体内容类型Content-Type对应关系库和多媒体后缀名对应关系库。

可选地，所述根据多媒体规律规则库对所述预处理数据集进行多媒体信息识别，包括：