[发明专利]声音区间检测装置、声音区间检测方法以及记录介质有效
| 申请号: | 201910195826.0 | 申请日: | 2019-03-15 |
| 公开(公告)号: | CN110299153B | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 富田宽基 | 申请(专利权)人: | 卡西欧计算机株式会社 |
| 主分类号: | G10L25/84 | 分类号: | G10L25/84;G10L25/78;G10L25/24;G10L25/06;G10L15/02 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 区间 检测 装置 方法 以及 记录 介质 | ||
1.一种声音区间检测装置,其中,具备:
处理器;以及
存储器,构成为通过执行该存储器中存储的命令,使得上述处理器执行以下的处理:
从靶声音信号检测包括特定声音信号的特定声音区间,上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态,且该音素的状态是将每个音素沿时间方向细分为多个音素的状态后的音素的状态,
通过从上述靶声音信号至少除去检测出的上述特定声音区间,来从该靶声音信号检测包括语音信号的语音区间,上述语音信号表示由说话人发出的语音。
2.根据权利要求1所述的声音区间检测装置,其中,
在上述特定声音区间的检测中,从上述靶声音信号中的候补区间检测上述特定声音区间,
在上述语音区间的检测中,将上述候补区间中的、检测出的上述特定声音区间以外的区间检测为上述语音区间。
3.根据权利要求2所述的声音区间检测装置,其中,
在上述语音区间的检测中,将上述候补区间中的、检测出的上述特定声音区间以外的区间中的时间长度为判定时间以上的区间检测为上述语音区间。
4.根据权利要求1至3任意一项所述的声音区间检测装置,其中,
针对上述靶声音信号中的时间上连续的多个帧的每一个,基于对该帧所包含的声音信号表示各子音的音素的各状态的后验概率的概率分布、与该帧紧前的帧所包含的声音信号表示各子音的音素的各状态的后验概率的概率分布的相关程度进行表示的相关系数是否为阈值以上,来判定各帧是否包含与对该紧前的帧所包含的子音的音素的状态进行表示的声音信号相同的声音信号,
在上述特定声音区间的检测中,将上述靶声音信号中的区间检测为上述特定声音区间,其中,上述靶声音信号中的区间包括比特定个数多的个数的帧,并且,被判定为该区间所包含的全部帧分别包含与表示各帧的紧前的帧所包含的子音的音素的状态的声音信号相同的声音信号。
5.根据权利要求1所述的声音区间检测装置,其中,
上述特定时间是与各子音的音素的各状态被说话人发音的时间长度的平均值对应的时间。
6.根据权利要求1所述的声音区间检测装置,其中,
由输出装置输出检测出的上述语音区间。
7.一种由声音区间检测装置执行的方法,其中,
上述声音区间检测装置具备:处理器;以及存储器,存储由上述处理器执行的命令,
上述方法包括以下步骤:
从靶声音信号检测包括特定声音信号的特定声音区间,上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态,且该音素的状态是将每个音素沿时间方向细分为多个音素的状态后的音素的状态,
通过从上述靶声音信号至少除去检测出的上述特定声音区间,来从该靶声音信号检测包括语音信号的语音区间,上述语音信号表示由说话人发出的语音。
8.根据权利要求7所述的由声音区间检测装置执行的方法,其中,
在上述特定声音区间的检测中,从上述靶声音信号中的候补区间检测上述特定声音区间,
在上述语音区间的检测中,将上述候补区间中的、检测出的上述特定声音区间以外的区间检测为上述语音区间。
9.根据权利要求8所述的由声音区间检测装置执行的方法,其中,
在上述语音区间的检测中,将上述候补区间中的、检测出的上述特定声音区间以外的区间中的时间长度为判定时间以上的区间检测为上述语音区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910195826.0/1.html,转载请声明来源钻瓜专利网。





