[发明专利]控制包含语音的音频数据的回放的方法、计算设备和介质有效
申请号: | 201680083591.0 | 申请日: | 2016-03-16 |
公开(公告)号: | CN108885869B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | O·索恩 | 申请(专利权)人: | 索尼移动通讯有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/05;G10L15/26;G10L17/00;G10L15/04;G10L15/08;G10L15/22 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 黄纶伟;王青芝 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制 包含 语音 音频 数据 回放 方法 计算 设备 介质 | ||
1.一种在包括处理器(3)的计算设备(1)上控制包含语音的音频数据(A)的回放的方法,所述方法由所述计算设备(1)中的所述处理器(3)执行,并且包括以下步骤:
在所述计算设备(1)上操作媒体播放器,以播放所述音频数据(A),
检测用于在所述音频数据(A)中前进或后退的用户发起的时移命令,以及
在所述音频数据(A)中的当前时间(tc)处检测到所述时移命令之后,标识所述音频数据(A)中的多个连续可选择句子中的句子的起始点,并且操作所述媒体播放器以从所述起始点处播放所述音频数据(A),所述音频数据的至少一部分被组织成针对所述当前时间的任意值包括所述当前时间的时间窗口中的所述多个连续可选择句子。
2.根据权利要求1所述的方法,其中,基于所述音频数据(A)的自然语言处理来标识所述句子的所述起始点。
3.根据权利要求2所述的方法,其中,所述自然语言处理包括:通过对所述音频数据(A)操作语音识别算法来生成与所述音频数据(A)相对应的文本,并且通过对所述文本操作句子分割算法来将所述文本分割成所述多个连续可选择句子。
4.根据权利要求1所述的方法,其中,所述时移命令指示在所述音频数据(A)中后退,并且其中,所述起始点被标识为下列项中的一方:
所述多个连续可选择句子中的与所述音频数据(A)在所述当前时间(tc)的当前话题有关的一组连续句子的起始点;
所述多个连续可选择句子中的与所述当前时间(tc)有预定关系的一组连续句子的起始点;
所述多个连续可选择句子中的与所述当前时间(tc)的当前讲话者相关联的一组连续句子的起始点,或所述多个连续可选择句子中的紧在与所述当前讲话者相关联的一组连续句子之前的与另一讲话者相关联的一组连续句子的起始点;以及
所述多个连续可选择句子中的提供所述音频数据(A)中的在所述当前时间(tc)之前的时间段的内容总结的一组连续句子的起始点。
5.根据权利要求4所述的方法,其中,所述预定关系被限定为使得所述一组连续句子包括在所述当前时间(tc)处最近开始的句子。
6.根据权利要求4或5所述的方法,其中,所述起始点、所述多个连续可选择句子中的所述一组连续句子中的连续句子的数目、所述多个连续可选择句子中的所述一组连续句子中的句子的数目、以及所述时间段中的至少一方作为控制变量(76)的函数来获得,所述控制变量(76)包括下列项中的一个或更多个:
在所述当前时间(tc)的文本复杂度指数,所述文本复杂度指数指示所述音频数据(A)中的在所述当前时间(tc)的口语的复杂度;
所述音频数据(A)的种类分类;
在通过暂停触发了所述时移命令的情况下的所述媒体播放器的暂停持续时间;
针对一组不同用户在所述音频数据(A)中在所述当前时间(tc)处时移命令的发生率;以及
与所述计算设备(1)的命令接口(6)的用户交互,所述用户交互包括与所述命令接口(6)的所述用户交互的持续时间、施加到所述命令接口(6)的压力的程度、以及对所述命令接口(6)上的多个命令元件(7A、7B、7C)当中的一个命令元件的用户选择中的一个或更多个。
7.根据权利要求1所述的方法,其中,所述时移命令指示在所述音频数据(A)中前进,并且其中,所述起始点被标识为下列项中的一方:
所述多个连续可选择句子中的与不同于所述音频数据(A)的在所述当前时间(tc)的当前话题的话题有关的句子的起始点;
所述多个连续可选择句子中的与所述当前时间(tc)有预定关系的句子的起始点;以及
所述多个连续可选择句子中的与不同于在所述当前时间(tc)的当前讲话者的讲话者相关联的句子的起始点。
8.根据权利要求7所述的方法,其中,所述预定关系作为所述多个连续可选择句子中的在所述当前时间(tc)之后开始的句子的计数来给出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼移动通讯有限公司,未经索尼移动通讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680083591.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车用效果声发生装置
- 下一篇:声学地图命令情境化和设备控制