[发明专利]基于音频特征的收视率调查系统及收视信息检索方法无效
申请号: | 200910258317.4 | 申请日: | 2009-12-04 |
公开(公告)号: | CN101720048A | 公开(公告)日: | 2010-06-02 |
发明(设计)人: | 田岚;赵静;王晓霞 | 申请(专利权)人: | 山东大学 |
主分类号: | H04N17/00 | 分类号: | H04N17/00;G10L15/02 |
代理公司: | 济南圣达专利商标事务所有限公司 37221 | 代理人: | 张勇 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 音频 特征 收视率 调查 系统 收视 信息 检索 方法 | ||
1.一种基于音频特征的收视率调查系统的收视信息检索方法,该系统主要由用户端数据采集系统和中心端数据处理系统两大部分构成,用户端数据采集系统包括音频采集模块、特征提取模块、数据编码存储模块及发送模块,其中音频采集模块采集电视机AV端子的音频信号,音频采集模块与特征提取模块连接,特征提取模块对采集的音频信号进行谱能量特征提取,提取的数据经编码打包后送入数据编码存储模块,数据编码存储模块再通过发送模块定期发送数据到中心端数据处理系统;中心端数据处理系统包括相应的接收模块和数据处理模块,数据处理模块根据用户端采集的音频信号与标准音频库中各收视台的标准音频信号进行比对,搜索出采集的音频信号所匹配的标准音频信号所对应的收视台码信息,据此统计电视台的收视率,其特征是,
1)采集电视机AV端口的音频数据;
2)对采集到的音频数据提取其谱能量特征作为音频特征矢量,提取时将两次频道切换间采集的第一个有效收视时长数据包作为头包,并按包长不断采集并刷新第二个数据包的起始时刻和采集数据,以此作为尾包,并将头包或尾包属性、各包对应的起始时刻和相应的音频特征矢量数据编码打包,加以存储;若用户收看某频道的收视时长达不到一个有效收视时长即包长,则作为无效收视,不予记录存储;若用户收看某频道的收视时长大于一个包长而小于两个包长,则只记录存储头包的数据,即单包情况;若用户收看某频道的收视时长大于两个包长,期间不论长短,尾包始终跟踪记录换频道或断电前的最后一个有效包长的起始时刻和音频数据,并以两个数据包即“头包+尾包”的形式加以记录存储,即双包情况;这样,基于音频特征的用户收视记录数据便以一系列的“头包+尾包”或仅有“头包”的形式按频道切换时间顺序编码存储;
3)上述音频特征数据存储到数据编码存储模块,并定期自动上传到中心端数据处理系统;
4)中心端数据处理系统对接收的音频数据判断其是头包还是尾包,然后从中心端数据处理系统包含所有频道音频的标准音库中截取各频道与头包或尾包对应时刻的标准音频数据段,并对其按照与步骤2)提取谱能量特征的相同处理方法计算出各标准音频谱能量特征,并作为标准音频特征矢量集,将头包音频特征矢量和尾包音频特征矢量分别与标准音频特征矢量集做距离比对,距离最小者的标准音频所对应的频道台号,即为相应的头包的台号X或尾包的台号Y;比对台号X与台号Y是否相等,如两者相等,则该台号即为检索出的正确台号;如两者不相等,则进行二次检索,二次检索后得到的台号即为正确台号;
二次检索过程为,将接收的头包音频特征矢量和尾包音频特征矢量组成一个测试联合特征矢量,同时将初判得出的头包和尾包不同频道号对应的标准库对应音段的候选音频也分别按对应顺序组成候选联合特征矢量,将测试联合特征矢量与两个候选联合特征矢量再分别作距离计算,取其中距离最小者,其对应台号即为最终检索出的频道号;
5)中心端数据处理系统以得到的正确台号为基础作收视率统计。
2.如权利要求1所述的基于音频特征的收视率调查系统的收视信息检索方法,其特征是,所述步骤1)中,采集音频数据时,利用用户遥控器发出的频道切换码作为音频数据采集的起始计时标记,并按有效收视时长跟踪记录用户收看频道的音频数据。
3.如权利要求1所述的基于音频特征的收视率调查系统的收视信息检索方法,其特征是,所述步骤2)中,谱能量特征提取方法为,逐帧对指定通带上对应频谱幅度值的能量做统计平均,即:将采集的每个包长音频数据按帧长截取,经FFT变换,在频域上将每帧数据覆盖的整个频率范围划分成指定的M个通带,算出各频带对应的谱能量,其中去除了因电视机的高/低音响变化导致谱能量特征值出现波动的通带;同时,对选定通带上的幅值做能量归一,以避免同一音段因音量变化导致谱能量特征值大小不一的情况。
4.如权利要求1所述的基于音频特征的收视率调查系统的收视信息检索方法,其特征是,所述步骤4)中,数据处理中心端对收视台号进行检索时,鉴于用户端和数据处理中心端的时钟可能存在偏差,引入时间余量方法,即将选出的各候选音段的时间范围均扩大时长,并在各扩大的候选音段中按照搜索步长推移、逐一截取数据包长,对截取的一系列标准音库中的音段按步骤2)的方法提取候选谱能量特征矢量,得到候选音段特征矢量集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910258317.4/1.html,转载请声明来源钻瓜专利网。