[发明专利]语音处理装置及语音处理方法在审
| 申请号: | 201410211542.3 | 申请日: | 2014-05-19 |
| 公开(公告)号: | CN104183246A | 公开(公告)日: | 2014-12-03 |
| 发明(设计)人: | 盐田千里;外川太郎;大谷猛 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L21/01 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;李春晖 |
| 地址: | 日本神*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 装置 方法 | ||
技术领域
本文中所讨论的实施方式涉及一种控制例如输入信号的语音处理装置、语音处理方法以及语音处理程序。
背景技术
响应于信息处理设备开发和国际化的最新进展,存在越来越多的机会来观看和收听第二语言的内容以及通过个人计算机中所安装的电话呼叫应用来以第二语言进行呼叫。在这些情况下,公开了通过其来控制第二语言的语音信号(输入信号的示例)使得语音信号易于收听的方法。在例如日本特许公开公报第10-133678号中,公开了一种通过从语音信号提取声音时段并将无声时段加至声音时段的后端来使得输入语音易于理解的技术。已知用户通常进行重复性无声语,在该重复性无声语中,用户通过无可听得见的发音的内部讲话回读用户所听到的难以理解的第二语言的词(例如参见Sinozuka Katsumasa,Listening Power in Second language and Working Memorytransactions No.40,2008at Department of English literature,Graduate School of Literature,Seijo University)。因此,为了理解第二语言,重要的是确保用于重复性无声语的无声时段。
当加入无声时段以理解输入语音时,语音处理被延迟。如果例如用户观看和收听内容,则视觉/音频时间被延长。当用户进行呼叫时,出现了另外的问题:由于语音处理被延迟,因此以正常速度进行对话变得困难。因此,当确保用于重复性无声语的无声时段时,期望的是抑制语音处理的延迟。然而,由于在无声时段的长度与语音处理被延迟的量之间存在比例关系,因此还未提出一种抑制语音处理的延迟的语音处理装置。鉴于上述情况,本发明的目的是提供一种可以抑制语音处理的延迟并且还可以改进用户对输入语音的理解的语音处理装置。
发明内容
根据实施方式的一个方面,语音处理装置包括处理器,该装置包括:获取单元,该获取单元被配置成获取输入语音;检测单元,该检测单元被配置成检测输入语音中所包括的声音时段和与声音时段的后端相邻的无声时段;计算单元,该计算单元被配置成计算声音时段中所包括的词的数量;以及控制单元,该控制单元被配置成根据词的数量来控制无声时段的长度。
将借助于权利要求中具体指出的要素和组合来实现和获得本发明的目的和优点。
将理解,如所要求保护的,前述的一般描述和下面的详细描述两者均是示例性的和说明性的,并且不是对本发明的限制。
本公开内容中的语音处理装置可以抑制语音处理的延迟,并且还可以改进用户对输入语音的理解。
附图说明
根据以下结合附图进行的对实施方式的描述,这些和/或其他方面和优点将变得明显且更易于理解,在附图中:
图1是第一实施方式中的语音处理装置的功能框图;
图2是实施方式中的检测单元的功能框图;
图3示出了由检测单元检测的声音时段和无声时段;
图4示出了作为声学特征的示例的音拍(mora)的数量与词的数量之间的关系;
图5示出了声音时段中所包括的词的数量与用于理解的无声时段的长度之间的关系;
图6是由语音处理装置执行的语音处理的流程图;
图7示出了输入语音功率与所提取的功率突变的数量之间的关系;
图8示出了作为声学特征的示例的功率突变的数量与词的数量之间的关系;
图9是第二实施方式中的语音处理装置的功能框图;
图10是第三实施方式中的语音处理装置的功能框图;
图11是实施方式中的用作语音处理装置的计算机的硬件结构;以及
图12是实施方式中的移动终端装置的硬件结构。
具体实施方式
将参照附图来描述实施方式中的语音处理装置、语音处理方法以及语音处理程序的示例。这些示例不限制所公开的技术。
(第一实施方式)
图1是第一实施方式中的语音处理装置1的功能框图。语音处理装置1包括获取单元2、检测单元3、提取单元4、计算单元5以及控制单元6。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社;,未经富士通株式会社;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410211542.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频播放方法及装置
- 下一篇:用于便携式终端的语音处理方法及装置





