[发明专利]声音识别装置有效
申请号: | 200980149034.4 | 申请日: | 2009-10-20 |
公开(公告)号: | CN102239517A | 公开(公告)日: | 2011-11-09 |
发明(设计)人: | 铃木忠;石川泰;丸田裕三 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 侯颖媖 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 识别 装置 | ||
1.一种声音识别装置,其特征在于,包括:
声音标准模型存储器,该声音标准模型存储器存放有与作为识别对象的多种语言相对应的声音标准模型;
声音标识存储器,该声音标识存储器保存与多种语言相对应的用户词典;
第一语言切换单元,该第一语言切换单元切换选择所述声音标准模型存储器的多种语言;
第二语言切换单元,该第二语言切换单元切换选择所述声音标识存储器的多种语言;
控制单元,该控制单元将所述第一语言切换单元和第二语言切换单元联动地进行切换;
音响分析单元,该音响分析单元对所输入的用户说话声实施音响分析处理,以输出所述用户说话声的特征矢量时间序列;以及
声音识别单元,该声音识别单元根据来自所述音响分析单元的特征矢量时间序列、以及与在切换所述第一语言切换单元的同时被选择的、所述声音标准模型存储器的语言相对应的声音标准模型的数据,来生成与所述输入的用户说话声相对应的声音标识串,并将该声音标识串登录到与所述第一语言切换单元联动地由所述第二语言切换单元所切换的、所述声音标识存储器的语言。
2.如权利要求1所述的声音识别装置,其特征在于,包括:
第三语言切换单元,该第三语言切换单元切换选择声音标识存储器的多种语言;以及
识别/登录切换单元,该识别/登录切换单元对是将声音识别单元的识别结果输出至外部还是将其登录至声音标识存储器进行选择,
控制单元基于输出指示将所述识别/登录切换单元切换到识别,并将第一语言切换单元和所述第三语言切换单元联动地进行切换,声音识别单元根据所输入的用户说话声的特征矢量时间序列、以及与在切换所述第一语言切换单元的同时被选择的、所述声音标准模型存储器的语言相对应的声音标准模型的数据,从所述声音标识存储器读出与所述输入的用户说话声相对应的声音标识,并通过所述识别/登录切换单元来进行输出。
3.如权利要求1所述的声音识别装置,其特征在于,包括:
语言选择单元,该语言选择单元基于从外部提供的语言指定数据来选择语言,
控制单元将第一语言切换单元和第二语言切换单元联动地进行切换,从而基于由所述语言选择单元所选择的语言来选择与该语言相对应的语言。
4.一种声音识别装置,其特征在于,包括:
声音标准模型存储器,该声音标准模型存储器存放有与作为识别对象的多种语言相对应的声音标准模型;
声音标识存储器,该声音标识存储器保存用户词典;
第一语言切换单元,该第一语言切换单元切换选择所述声音标准模型存储器的多种语言;
控制单元,该控制单元基于指示语言,将所述第一语言切换单元切换到指示语言选择位置;
声音数据存储器,该声音数据存储器保存用户所发出的声音;
音响分析单元,该音响分析单元对所输入的用户说话声或从所述音响数据存储器读出的用户说话声实施音响分析处理,并输出所述用户说话声的特征矢量时间序列;以及
声音识别单元,该声音识别单元基于与由所述第一语言切换单元所选择的语言相对应的声音标准模型的数据、以及所述特征矢量时间序列,来生成与用户说话声相对应的声音标识,并将该声音标识登录至所述声音标识存储器。
5.一种声音识别装置,其特征在于,包括:
声音标准模型存储器,该声音标准模型存储器存放有与作为识别对象的多种语言相对应的声音标准模型;
声音标识存储器,该声音标识存储器保存用户词典;
第一语言切换单元,该第一语言切换单元切换选择所述声音标准模型存储器的多种语言;
控制单元,该控制单元基于指示语言,将所述第一语言切换单元切换到指示语言选择位置;
音响分析单元,该音响分析单元对所输入的用户说话声实施音响分析处理,以输出所述用户说话声的特征矢量时间序列;
声音数据存储器,该声音数据存储器保存由所述音响分析单元进行音响分析而获得的特征矢量时间序列;以及
声音识别单元,该声音识别单元基于与由所述第一语言切换单元所选择的语言相对应的声音标准模型的数据、以及从所述音响数据存储器读出的特征矢量时间序列,来生成与用户说话声相对应的声音标识,并将该声音标识登录至所述声音标识存储器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980149034.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:Ⅲ族氮化物半导体发光器件
- 下一篇:运动自适应用户界面服务