[发明专利]基于音节识别的视频点播方法无效
| 申请号: | 201210486825.X | 申请日: | 2012-11-26 |
| 公开(公告)号: | CN102970618A | 公开(公告)日: | 2013-03-13 |
| 发明(设计)人: | 吕勇 | 申请(专利权)人: | 河海大学 |
| 主分类号: | H04N21/81 | 分类号: | H04N21/81;G10L15/02;G10L15/06;G10L15/08 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210098 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 音节 识别 视频点播 方法 | ||
1.一种基于音节识别的视频点播方法,其特征在于:包括训练阶段和识别阶段的方法;其中在训练阶段,首先对视频名称库中的每个视频名称进行音节提取,得到视频音节序列库,然后进行中/英文模型训练、音节模型训练、音节上下文训练和音节索引提取,分别得到中/英文识别模型、音节模型、音节序列上下文模型和音节索引库;在识别阶段,对用户输入的待识别语音进行语音切分后,首先进行中/英文名称识别,识别出是中文名称或英文名称;然后用中文音节模型或英文音节模型进行音节识别,得到待识别语音的音节序列;最后利用音节索引库和音节序列上下文模型进行音节序列的匹配解码,得到视频名称。
2.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:从视频名称库中提取音节,得到每个视频名称的音节序列,将每个视频名称归类到其音节索引中,对于含有多个音节的视频名称,将其归类到多个不同的音节中。
3.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:通过每个音节的训练语音,训练生成该音节的隐马尔可夫模型,完成音节模型的建立。
4.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:将待识别视频名称的语音切分后,并用音节HMM识别为音节序列。
5.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:对中文音节,为汉语的每个音节建立索引库;对于英文音节,需要对音节进行聚类,将其划分为若干类,只对视频名称库中每一类英文音节进行建模。
6.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:用中文音节的训练语音,训练生成中文高斯混合模型;用英文音节的训练语音,训练生成英文GMM;用中/英文GMM模型对待识别视频名称的语音进行语言识别,区分中文视频名称和英文视频名称。
7.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:为待识别音节序列每个音节标注权重,在视频名称库中音节出现的概率越小,其权重就越大,反之权重越小;权重信息标注在音节序列的上下文模型中,用于待识别语音序列的匹配解码。
8.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:根据待识别音节序列的匹配解码结果,除了以概率最大的视频名称作为输出结果外,还为用户提供多个备选结果,并根据输出概率大小进行排序,供用户选择。
9.如权利要求1所述的基于音节识别的视频点播方法,其特征在于:当用户增添视频内容时,将增加的视频名称归属到其相应的音节索引中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210486825.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种故障处理方法及分布式基站
- 下一篇:一种网络电视的控制方法、装置和系统





