[发明专利]中国人名、地名和单位名的语音识别方法有效
| 申请号: | 00132741.0 | 申请日: | 2000-11-15 |
| 公开(公告)号: | CN1151489C | 公开(公告)日: | 2004-05-26 |
| 发明(设计)人: | 徐波;张红 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00 |
| 代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 刘秀娟 |
| 地址: | 100080北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 中国人名、地名和单位名的语音识别方法采用通用汉语语音模型以及以字和词为单位的专用三元概率模型构成语音识别系统进行无词汇限制、无说话人限制的语音输入。针对中国人名识别混淆度大的特点,本发明提出了一个能给出多个候选字的算法;针对某些应用其人名、地名和单位名是有限的约束条件,提出了一种基于半音节混淆度为基础的整体模糊匹配方法,使识别率进一步得到提高。本发明可广泛地应用于各种手持式设备的语音输入。 | ||
| 搜索关键词: | 中国 人名 地名 单位 语音 识别 方法 | ||
【主权项】:
1.一种中国人名、地名和单位名的语音识别方法,利用大词汇量连续语音识别技术,建立通用的统计语音模型和专用的统计语言模型,并采用有关搜索算法进行最优搜索给出识别中间结果;如为无词汇限制的识别,则通过按照最优序列切分输出多个候选结果;如为有词汇限制的识别,则通过与词汇表的动态相似性匹配,输出候选结果;其特征在于,其中的专用语言模型是在搜集大量中国人名、地名和单位名的基础上,采用大语料库技术统计而得;这种统计的特点在于在分析中国人名和地名的构成特点的基础上,按不同的基本统计单元,分别建立统计模型,用于识别系统之中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/00132741.0/,转载请声明来源钻瓜专利网。





