[发明专利]声音区间检测装置、声音区间检测方法以及记录介质有效

申请号：	201910195826.0	申请日：	2019-03-15
公开（公告）号：	CN110299153B	公开（公告）日：	2023-07-25
发明（设计）人：	富田宽基	申请（专利权）人：	卡西欧计算机株式会社
主分类号：	G10L25/84	分类号：	G10L25/84;G10L25/78;G10L25/24;G10L25/06;G10L15/02
代理公司：	永新专利商标代理有限公司 72002	代理人：	徐殿军
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音区间检测装置方法以及记录介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种声音区间检测装置，其中，具备：

处理器；以及

存储器，构成为通过执行该存储器中存储的命令，使得上述处理器执行以下的处理：

从靶声音信号检测包括特定声音信号的特定声音区间，上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态，且该音素的状态是将每个音素沿时间方向细分为多个音素的状态后的音素的状态，

通过从上述靶声音信号至少除去检测出的上述特定声音区间，来从该靶声音信号检测包括语音信号的语音区间，上述语音信号表示由说话人发出的语音。

2.根据权利要求1所述的声音区间检测装置，其中，

在上述特定声音区间的检测中，从上述靶声音信号中的候补区间检测上述特定声音区间，

在上述语音区间的检测中，将上述候补区间中的、检测出的上述特定声音区间以外的区间检测为上述语音区间。

3.根据权利要求2所述的声音区间检测装置，其中，

在上述语音区间的检测中，将上述候补区间中的、检测出的上述特定声音区间以外的区间中的时间长度为判定时间以上的区间检测为上述语音区间。

4.根据权利要求1至3任意一项所述的声音区间检测装置，其中，

针对上述靶声音信号中的时间上连续的多个帧的每一个，基于对该帧所包含的声音信号表示各子音的音素的各状态的后验概率的概率分布、与该帧紧前的帧所包含的声音信号表示各子音的音素的各状态的后验概率的概率分布的相关程度进行表示的相关系数是否为阈值以上，来判定各帧是否包含与对该紧前的帧所包含的子音的音素的状态进行表示的声音信号相同的声音信号，

在上述特定声音区间的检测中，将上述靶声音信号中的区间检测为上述特定声音区间，其中，上述靶声音信号中的区间包括比特定个数多的个数的帧，并且，被判定为该区间所包含的全部帧分别包含与表示各帧的紧前的帧所包含的子音的音素的状态的声音信号相同的声音信号。

5.根据权利要求1所述的声音区间检测装置，其中，

上述特定时间是与各子音的音素的各状态被说话人发音的时间长度的平均值对应的时间。

6.根据权利要求1所述的声音区间检测装置，其中，

由输出装置输出检测出的上述语音区间。

7.一种由声音区间检测装置执行的方法，其中，

上述声音区间检测装置具备：处理器；以及存储器，存储由上述处理器执行的命令，

上述方法包括以下步骤：

8.根据权利要求7所述的由声音区间检测装置执行的方法，其中，

在上述特定声音区间的检测中，从上述靶声音信号中的候补区间检测上述特定声音区间，

在上述语音区间的检测中，将上述候补区间中的、检测出的上述特定声音区间以外的区间检测为上述语音区间。

9.根据权利要求8所述的由声音区间检测装置执行的方法，其中，