[发明专利]一种标签式视频文件的检索方法有效

申请号：	201811218512.X	申请日：	2018-10-19
公开（公告）号：	CN109299324B	公开（公告）日：	2022-03-04
发明（设计）人：	梁效宁;杨博	申请（专利权）人：	四川巧夺天工信息安全智能设备有限公司
主分类号：	G06F16/73	分类号：	G06F16/73;G06F16/71
代理公司：	暂无信息	代理人：	暂无信息
地址：	641000 ***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种标签视频文件检索方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种标签式视频文件的检索方法，其特征在于包括以下步骤:S100：根据视频文件的时间戳，添加所选定时间节点的文字标签和/或声纹标签；S200：将文字标签与对应的时间节点及对应的视频帧进行关联并建立索引，生成文本数据库；将声纹标签与对应的时间节点及对应的视频帧进行关联并建立索引，生成声纹数据库；S300：采集待检索人员的人声，获取并记录待检索人员的人声的声纹特征，并对人声进行特征采样，在所述索引中对比声纹特征的相似度，获取相似度最高的索引信息，并获取待检索人员信息，形成检索依据；S400：在声纹数据库中采用声纹检索和/或在文本数据库中采用文本检索，并获取检索结果。

技术领域

本发明属于安防及监控领域，涉及一种视频文件的检索方法，具体涉及一种标签式视频文件的检索方法。

背景技术

视频作为信息涵盖量最大、记录方式最全面的一种信息记录手段，一直以来都被广泛应用在安防、经验传承、资料流转、娱乐等众多领域。但由于视频本身所表现内容无法直接被计算机解析，因此要对原始的视频根据所记录事件的内容进行精准检索就比较困难。其主要特点在于视频实际内容无法量化存储，因此无法像文字一样进行索引，也就无从精准检索。目前常见的检索方式有通过视频时间进行检索和通过图像识别技术对比视频帧记录的图像进行检索。现有技术各自存在不同的缺点：

1、通过视频的时间进行检索，该方法精度高，但逻辑性差，与实际内容并无直接关联。

2、使用图像识别技术对视频帧进行匹配检索。该方法可以针对人脸、场景进行识别，但速度慢，准确度也差强人意。

发明内容

本发明针对现有技术的不足问题，提出了一种标签式视频文件的检索方法，通过添加所选定时间节点的文字标签和/或声纹标签，建立索引并分别生成文本数据库和声纹数据库，通过声纹特征对人声进行特征采样，获取待检索人员信息，在声纹数据库中采用声纹检索和/或在文本数据库中采用文本检索，并获取检索结果，从而达到对视频文件检索的目的，包括以下步骤:

S100：根据视频文件的时间戳，添加所选定时间节点的文字标签和声纹标签；

S200：将文字标签与对应的时间节点及对应的视频帧进行关联并建立索引，生成文本数据库；将声纹标签与对应的时间节点及对应的视频帧进行关联并建立索引，生成声纹数据库；

S300：采集待检索人员的人声，获取并记录待检索人员的人声的声纹特征，并对人声进行特征采样，在所述索引中对比声纹特征的相似度，获取相似度最高的索引信息，并获取待检索人员信息，形成检索依据；

S400：在声纹数据库中采用声纹检索和/或在文本数据库中采用文本检索，并获取检索结果。

优选地，所述步骤S100包含以下具体步骤：

S101：记录所述时间点的时间标签和文字标签；

S102：获取所述时间点前后N秒内所记录的人声，获取并记录人声的声纹特征，其中，N为大于0的自然数；

S103：将每一声纹特征与各个人员的人声及人员信息进行匹配，生成声纹标签；

S104：将带时间戳的文字标签和带时间戳的声纹标签，按相同的时间戳形成一一对应的关系并记录在列表中。

优选地，步骤S200的具体步骤如下：

S201：遍历所述步骤S104的列表，以时间节点为主键，将同一时间节点的文字标签和/或声纹标签进行归集，生成以时间节点为主键的标签记录；

S202：遍历过程中，添加不同人员的人声的声纹特征，将声纹特征与人员的人声进行匹配，并将人员的人声与声纹特征进行关联，生成新的数据列表；