[发明专利]大量说话人识别(ID)系统及其相应方法无效

申请号：	03814215.5	申请日：	2003-06-04
公开（公告）号：	CN1662956A	公开（公告）日：	2005-08-31
发明（设计）人：	N·迪米特罗瓦;D·李	申请（专利权）人：	皇家飞利浦电子股份有限公司
主分类号：	G10L17/00	分类号：	G10L17/00
代理公司：	中国专利代理(香港)有限公司	代理人：	杨生平;陈景峻
地址：	荷兰艾***	国省代码：	荷兰;NL
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种存储器，存储用于使与大量说话人识别(ID)系统相关联的处理器实例化包括以下项的功能的计算机可读指令：音频分段和分类功能(F10)，接收一般音频数据(GAD)，并且产生多个段；特征提取功能(F12)，接收这些段，并且从中提取基于Me1倒谱系数(MFCC)的特征；学习和聚类功能(14)，接收所提取的特征，并且根据所提取的特征在必要时对段进行重新分类；匹配和标注功能(16)，将说话人ID分配给GAD内的语音信号；以及数据库功能，用于将所分配的说话人ID与GAD内的相应语音信号相联系。音频分段和分类功能可以将每个段分配给N个音频信号类之一，其中N个音频信号类包括静默、单个说话人的语音、音乐、环境噪声、多个说话人的语音、同时语音和音乐、以及语音和噪声。
搜索关键词：	大量说话识别 id 系统及其相应方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种大量说话人识别(ID)系统(100，100’)，其从一般音频数据(GAD)识别归因于说话人的音频信号，该系统包括：用于将GAD分段(130，130’)成多个段的装置；用于将每个段分类(130，130’)为N个音频信号类之一的装置；用于从段中提取特征的装置；用于响应所提取的特征在必要时将段从N个音频信号类中的一个重新分类(130，130’)到另一个的装置；用于对这些段中的邻近段进行聚类(130，130’)从而产生聚类段的装置；以及用于以说话人ID标注(130，130’)每个聚类段的装置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司，未经皇家飞利浦电子股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/03814215.5/，转载请声明来源钻瓜专利网。

上一篇：光源装置及光偏转元件
下一篇：图像处理设备、成像设备、打印机驱动器、图像处理方法和计算机可读的储存介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]大量说话人识别(ID)系统及其相应方法无效

专利文献下载