[发明专利]电子装置及其操作方法在审
| 申请号: | 202010945809.7 | 申请日: | 2020-09-10 |
| 公开(公告)号: | CN112489691A | 公开(公告)日: | 2021-03-12 |
| 发明(设计)人: | 崔讚熙 | 申请(专利权)人: | 三星电子株式会社 |
| 主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/03;G10L15/08 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;杨莘 |
| 地址: | 韩国京畿道水*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电子 装置 及其 操作方法 | ||
电子装置包括存储器和处理器,存储器存储一个或多个指令,处理器配置为执行存储在存储器中的一个或多个指令以接收与用户话语对应的音频数据、基于接收到的音频数据识别用户话语特征、通过识别出的用户话语特征来确定用于执行语音活动检测的参数、以及通过使用确定出的参数针对用户话语对接收的音频数据执行语音活动检测。
相关申请的交叉引用
本申请基于并要求于2019年9月11日向韩国知识产权局提交的第10-2019-0113010号韩国专利申请的优先权,该申请的全部内容通过引用并入本文。
技术领域
本公开的各种实施方式涉及电子装置及其操作方法,并且更具体地,涉及用于检测关于用户话语的语音活动检测的电子装置及其操作方法。
背景技术
语音识别是指将通过声音传感器(例如麦克风)获取的音频信号转换为文本数据(例如单词或句子)的过程。随着用于提供语音识别的装置和服务的数量增加,语音识别在各种地方以各种形式得到了运用。
语音识别系统在执行语音识别之前执行语音活动检测(voice activitydetection,VAD),以区分音频信号中的话语部分和非话语部分。例如,由于没有必要对音频信号中的用户未出声的非话语部分执行语音识别,因此仅对通过VAD检测到的话语部分执行语音识别。
语音识别系统通过应用对一般情况下人的话语进行分析作为结果而获取的平均参数值来执行VAD。在这种情况下,当用户的话语速率相对低或高时会产生VAD误差。
公开内容
本公开的各种实施方式提供了能够根据用户话语特征改变参数以执行语音活动检测的电子装置及其操作方法。
附加方面将部分地在随后的描述中阐明,并且部分地将通过描述而显而易见,或可通过本公开提出的实施方式的实践来习得。
根据本公开的实施方式,电子装置包括存储一个或多个指令的存储器以及处理器,处理器配置为执行存储在存储器中的一个或多个指令,以接收与用户话语对应的音频数据、以基于接收到的音频数据识别用户的话语特征、通过使用识别的用户话语特征来确定用于执行语音活动检测的参数、以及通过使用确定出的参数关于用户话语对接收的音频数据执行语音活动检测。
在本公开的一个实施方式中,音频数据可包括与用户发出的触发词对应的话语部分。
在本公开的一个实施方式中,确定参数包括:将用户的话语特征与关于触发词的参考话语特征进行比较,并基于其比较的结果改变参数。
在本公开的一个实施方式中,识别用户的话语特征包括:当音频数据包括与触发词对应的话语部分时,基于接收到的音频数据识别用户的话语特征。
在本公开的一个实施方式中,执行语音活动检测可包括:在用户发声的情况下,检测接收到的音频数据中用户话语的起点和接收到的音频数据中用户话语的终点,以区分接收到的音频数据的话语部分和接收到的音频数据的非话语部分。
在本公开的一个实施方式中,识别出的用户的话语特征可包括用户话语速率、话语能级或发声音高中的至少一项。
在本公开的一个实施方式中,用于执行语音活动检测的参数可包括:在接收到的音频数据上用于识别在用户发声的情况下的话语部分的能量阈值、延迟时间或自动结束时间中的一个或多个。
在本公开的一个实施方式中,电子装置可进一步包括配置为接收与用户话语对应的音频数据的通信器。
在本公开的一个实施方式中,电子装置可进一步包括配置为接收用户话语并将用户话语转换为音频数据的麦克风。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010945809.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:校正用于加工工件的机床的工具参数的方法
- 下一篇:偏二氯乙烯系树脂保鲜膜





