[发明专利]声音区间检测装置、声音区间检测方法以及记录介质有效
| 申请号: | 201910195826.0 | 申请日: | 2019-03-15 |
| 公开(公告)号: | CN110299153B | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 富田宽基 | 申请(专利权)人: | 卡西欧计算机株式会社 |
| 主分类号: | G10L25/84 | 分类号: | G10L25/84;G10L25/78;G10L25/24;G10L25/06;G10L15/02 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 区间 检测 装置 方法 以及 记录 介质 | ||
本发明涉及声音区间检测装置、声音区间检测方法以及记录介质。声音区间检测装置具备:处理器;以及存储器,构成为通过执行该存储器中存储的命令,使得上述处理器执行以下的处理:从靶声音信号检测包括特定声音信号的特定声音区间,上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态,通过从上述靶声音信号至少除去检测出的上述特定声音区间,来从该靶声音信号检测包括语音信号的语音区间,上述语音信号表示由说话人发出的语音。
本申请以2018年3月22日申请的日本特願2018-053927和2019年2月15日申请的日本特願2019-025686为基础来主张优先权,将该基础申请的内容全部引入本申请。
技术领域
本发明涉及声音区间检测装置、声音区间检测方法以及记录介质。
背景技术
公知有一种从声音信号检测包括对由说话人发出的语音进行表示的语音信号的语音区间的技术。
例如,Zhang,X.-L.,Wu,J.,“Deep Belief Networks Based Voice ActivityDetection”,IEEE Transactions on Audio,Speech,and Language Processing,Vol.21,No.4,pp697-710,(2013)公开了一种使用DBN(Deep Belief Network:深度信念网络)从声音信号检测语音区间的方法。
在使用上述的文献所公开的方法从声音信号检测出语音区间时,是该声音信号中的区间,有时包括对由说话人以外的声源发出的噪声声音进行表示的噪声声音信号但不包含语音信号的区间被误检测为语音区间。
因为误检测语音区间,而产生了以下那样的问题。例如,在从长时间录音的声音数据中只检测人说话的部分而想要只对检测出的声音数据进行再生的情况下,如果误检测了语音区间,则需要对不必要的声音数据也进行再生。另外,例如在一边对声音进行录音(输入)、一边想要实时执行语音的声音识别的情况下,由于误检测语音区间,会导致在不是语音时也执行声音识别,大量消耗必要以上的资源(计算量)。
另外,在语音区间的检测精度低的情况下,产生了以下那样的问题。例如,由于检测出的对象有时不是人声而是噪声、环境音,所以在重听检测到的声音数据时,要使用不必要的时间。另外,例如说话的部分未被检测而从检测结果中缺失,导致漏听需要进行重听的声音数据。并且,由于语音区间的检测精度低,所以有时发声区间的前端、一部分未被检测而从检测结果中缺失,该情况下,当将该检测结果的声音数据作为输入数据进行了声音识别时,成为识别精度降低的理由之一。
因此,要求使语音区间的检测精度提高。
发明内容
本发明基于上述情况,其目的在于,提供使根据声音信号来检测包括对由说话人发出的语音进行表示的语音信号的语音区间时的检测精度提高的声音区间检测装置、声音区间检测方法以及记录介质。
本发明涉及一种声音区间检测装置,其中,具备:处理器;以及存储器,构成为通过执行该存储器中存储的命令,使得上述处理器执行以下的处理:从靶声音信号检测包括特定声音信号的特定声音区间,上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态,通过从上述靶声音信号至少除去检测出的上述特定声音区间,来从该靶声音信号检测包括语音信号的语音区间,上述语音信号表示由说话人发出的语音。
另外,本发明涉及一种由声音区间检测装置执行的方法,其中,上述声音区间检测装置具备:处理器;以及存储器,存储由上述处理器执行的命令,上述方法包括以下步骤:从靶声音信号检测包括特定声音信号的特定声音区间,上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态,通过从上述靶声音信号至少除去检测出的上述特定声音区间,来从该靶声音信号检测包括语音信号的语音区间,上述语音信号表示由说话人发出的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910195826.0/2.html,转载请声明来源钻瓜专利网。





