[发明专利]自动语音输入系统及其方法无效
申请号: | 201310739222.0 | 申请日: | 2013-12-27 |
公开(公告)号: | CN103761064A | 公开(公告)日: | 2014-04-30 |
发明(设计)人: | 郭彦闵;林立研 | 申请(专利权)人: | 圆展科技股份有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L25/84;G10L25/87 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 徐金国 |
地址: | 中国台湾新*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 语音 输入 系统 及其 方法 | ||
技术领域
本发明是有关于一种语音输入技术,且特别是有关于一种标点符号自动输入的自动语音输入系统及其方法。
背景技术
在讲求人机互动且运算芯片技术成熟的现今,自动语音输入技术已是目前系统产品所提供服务的发展重点之一,语音输入或语音辨识技术多半主要由隐马可夫模型为主流,利用语音数据所计算出的声纹特征线性以预估编码倒频谱矩阵,通过结果反推原因的机率,进而推论其语音的内容,进入到二十一世纪后,语音辨识技术陆续发展到加入前后文关系的判断方式,这也使得语音辨识的准确率大幅提升。然而,目前虽然语音输入的辨识能力已有不错的准确品质,但自动输入标点符号的功能仍有相当大的改良空间。
以微软推出的Windows7操作系统为例,其内建的语音输入服务在撰写文章或是在欲加入标点符号的场合时必须自行念出「逗号」、「句号」、「问号」或「点」等标点符号名称,使用起来相当不方便。除此之外,由前述可知,目前的语音辨识技术为了增加语音输入辨识结果的准确率,多半在计算模型中加入前后文判断的方式,但如此一来,若须自行念出标点符号名称以输入标点符号,则标点符号名称将容易与标点符号之外的语音文字混合,造成误判。例如:以语音输入方式念一段IP地址「192.168.40.3」时,其中的「.40.3」很容易被判断为「电视里电扇」;又例如欲输入「您好吗?不好意思」时,亦有可能得到「忙着问好不好」的结果,造成使用者在使用上的不便与困扰。
现行的自动语音输入技术须靠使用者自行念出标点符号名称以输入标点符号,且标点符号名称也容易与标点符号之外的语音文字混合,造成误判。因此,如何能利用语音侦测作为语音结尾、语音分段及顿挫的依据,利用频带能量分布状况作为语音扬升与否的依据,针对语音做结尾分析、顿挫分析及抑扬分析来自动判断标点符号,实属当前重要研发课题之一,亦成为当前相关领域极需改进的目标。
发明内容
本发明的一目的是在提供一种自动语音输入系统及自动语音输入方法,以解决先前技术的问题。
于一实施例中,本发明所提供的自动语音输入系统包含收音元件及语音辨识装置。收音元件用以取得语音;语音辨识装置包含录音元件及语音侦测元件;录音元件用以基于语音去储存数字信号数据;语音侦测元件用以根据数字信号数据,侦测语音于每一单位时段中的振幅及频谱,以判断语音的至少一中断处及中断处的一标点符号。
于一实施例中,当语音的振幅于单位时段中为背景噪音的平均振幅的1.5倍时,则语音侦测元件判断语音是于单位时段为连续,当语音的振幅于单位时段中低于背景噪音的平均振幅的1.5倍时,则语音侦测元件判断语音是于该单位时段为中断并从而具有中断处。
于一实施例中,当语音是于连续多个单位时段为中断且这些单位时段的连续数量达到第一预设数量时,则语音侦测元件判断中断处的标点符号是逗号。
于上述实施例中,当中断处的标点符号是逗号时,语音侦测元件将中断处前后一预设时间所对应的数字信号数据中的数据转换成频谱,并计算频谱中超过一频率值的频带能量的标准差,当频谱中超过此频率值的频带能量的标准差是该背景噪音的噪音频谱中超过此频率值的频带能量的标准差的1.5倍时,则语音侦测元件将中断处的标点符号从逗号改成问号。
于一实施例中,当语音是于连续多个单位时段为中断且这些单位时段的连续数量达到第二预设数量时,则语音侦测元件判断中断处的标点符号是句号。
于一实施例中,本发明所提供的自动语音输入方法包含:取得语音;基于语音去储存数字信号数据;根据数字信号数据,侦测语音于每一单位时段中的振幅及频谱,以判断语音的至少一中断处及中断处的标点符号。
于一实施例中,当语音的振幅于单位时段中为背景噪音的平均振幅的1.5倍时,则判断语音是于单位时段为连续,当语音的振幅于单位时段中低于背景噪音的平均振幅的1.5倍时,则判断语音是于单位时段为中断并从而具有中断处。
于一实施例中,当语音是于连续多个所述单位时段为中断且这些单位时段的连续数量达到第一预设数量时,则判断中断处的标点符号是逗号。
于上述实施例中,当中断处的标点符号是逗号时,将中断处前后一预设时间所对应的数字信号数据中的数据转换成频谱,并计算频谱中超过一频率值的频带能量的标准差,当频谱中超过此频率值的频带能量的标准差是背景噪音的噪音频谱中超过此频率值的频带能量的标准差的1.5倍时,则将中断处的标点符号从逗号改成问号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于圆展科技股份有限公司,未经圆展科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310739222.0/2.html,转载请声明来源钻瓜专利网。