[发明专利]安多藏语语音音节切分的方法无效
申请号: | 200710097847.6 | 申请日: | 2007-04-20 |
公开(公告)号: | CN101290766A | 公开(公告)日: | 2008-10-22 |
发明(设计)人: | 戴玉刚;武光利;于洪志;曹晖;单广荣;满正行;李应兴 | 申请(专利权)人: | 西北民族大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 730030甘*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 安多 藏语 语音 音节 切分 方法 | ||
所属技术领域
安多藏语语音音节切分的方法是属于藏语语音库的制作和藏语语音识别领域,是第一关键技术。
背景技术
众所周知,语言是人类进行相互通信和交流的最方便最快捷的手段,它自然方便、快捷高效。随着电子计算机和人工智能的广泛应用,人和机器之间最好的通信方式是语言通信,而语音是语言的声学表现形式。要使机器听懂人讲话,并能说出话来,需要做许多工作,这就是语音合成和语音识别技术。在高度发达的信息社会中用数字化的方法进行语音的传送、储存、OR识别、合成、增强是整个数字化通信网中最重要、最基本的组成部分之一。
计算机的高速发展为我们更好地驾驭语言提供了可能。语音识别近年来得到了迅猛发展。人们不需要学习许多种计算机语言,只需要把要做的事情告诉给计算机,而计算机就可根据你的指令完成各种任务,工作也会变得更加有成效。如果你要播放影碟,那么你可以告诉计算机“播放影碟”而不用找到播放软件,在“打开”处单击一下,最后还需要在所要打开的文件再单击一下。语音识别使得语音输入代替了键盘输入,实现了人与计算机的直接对话,同时加速了信息的处理过程。
而藏语语音的信息处理,还基本上是一片空白,随着藏族人们生活的提高,藏族同胞急切的需要高科技给他们带来便利,以便更好的促进藏族地区的发展。藏族有统一的书面语,但其口语因地而异,至今尚未形成全民族公认的口头标准语或普通话,藏语分为三大方言,本文数据源采用的安多藏语。
藏语连续语音的自动分割是藏语语音识别和制作藏语音节库所遇到的第一关键技术。首先就要将藏语音节字从语音信号流的背景噪声中分割出来,找出语音的开始和终止。这在许多语音处理领域中是很基本的问题。特别是在孤立单字的自动识别时,找出每个单字的语音信号范围,将声母、韵母分割开是很重要的。确定语音信号的开始和终止的方案可用来减少非实时系统的大量计算,使该系统仅处理语音输入。只有将各音节中的声韵母区分开,才能进行藏语声学参数的分析和识别,才能进行藏语音库的制作。当然,如果不考虑分割的实时性,可以采用人工分割的方法:先将语言信号流的波形打印出来,然后用标尺在波形图上测量,就可以准确得到分割的结果。由于这种人工分割的准确性高,所以各种用计算机自动分割的准确度都是与人工分割结果比较而言的。
发明内容
藏语连续语音音节的自动分割是藏语语音识别和制作藏语音节库所遇到的第一关键技术。这在许多语音处理领域中是很基本的问题。通过藏语语音时域参数短时能量和短时过零率,来判断语音的音节,实现语音的音节切分。
本发明由以下几个部分组成:安多藏语语音时域参数的提取、藏语语音端点检测、音节切分算法的设计、切分结果的实现和显示。
1.安多藏语时域参数的提取
1.1短时能量
设语音信号为S(m),短时能量的定义:
若令h(n)=w2(n),则
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北民族大学,未经西北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710097847.6/2.html,转载请声明来源钻瓜专利网。