[发明专利]电子装置及其控制方法在审
申请号: | 202011426799.2 | 申请日: | 2020-12-09 |
公开(公告)号: | CN113038344A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 黄仁雨;金起范;金善民;许勳 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | H04R5/04 | 分类号: | H04R5/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;杨莘 |
地址: | 韩国京畿道水*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 装置 及其 控制 方法 | ||
提供了一种电子装置及其控制方法。电子装置包括输入器和处理器,处理器配置成:基于通过输入器接收到音频信号,获取音频信号的言语清晰度,并且修改音频信号使得言语清晰度成为目标清晰度,目标清晰度基于与包括在音频信号中的音频类型有关的场景信息来设置,音频类型包括音效、叫喊、音乐和言语中的至少一种。
相关申请的交叉引用
本申请以2019年12月9日在韩国知识产权局提交的第10-2019-0162644号韩国专利申请为基础并且要求该韩国专利申请的优先权,该韩国专利申请的公开内容以全文引用的方式并入本文。
技术领域
本发明涉及一种电子装置及其控制方法。更具体地,本公开涉及执行对应于用户言语的操作的电子装置以及电子装置的控制方法。
背景技术
随着因特网和流服务的发展,许多内容正在多媒体装置中被消费。然而,由于各种因素,包括诸如内容再现环境(环境噪声等)或装置扬声器的限制的环境因素、诸如室外记录或缺乏编辑时间等的内容制作因素,可能出现听不到包括在再现的内容中的言语的情况。
具体地,作为对由五个广播公司提供的音频信号的24小时分析的结果,已经发现言语内容的比率是大约91.8%,并且言语的功率和除言语之外的其他信号的功率是相同的。因此,该分析表明言语传输不好的部分是30%或更多。结果,更着重关注内容的言语传输能力。
在相关技术中,存在一种基于输入音频信号的非言语音量和言语概率来控制每个频带的功率,从而提高言语的清晰度的技术。
然而,在现有技术中,通过跟踪每个频带的功率的最小值来测量非言语音量,并且除了保持恒定的非言语之外,不可能适当地测量突然增加的非言语,并且由于记录麦克风、后校正等的灵敏度问题而不能精确地测量非言语。此外,由于通过按频带测量言语的概率来调整与最终输出相关的参数,所以相同频带的言语和非言语一起增加并用于输出。
此外,在现有技术中,由于对所有类型的输入内容仅执行增强言语清晰度的操作,因此存在根据音频内容的类型的制作者的制作意图没有反映在言语清晰度的控制中的问题。
发明内容
提供了一种执行与用户的言语对应的操作的电子装置及其控制方法。
另外的方面将部分地在随后的描述中阐述,并且部分地将从描述中显而易见,或者可以通过对所呈现的实施例的实践来获知。
根据本公开的一个方面,电子装置包括输入器和处理器,处理器配置成:基于通过输入器接收到音频信号,获取包括在音频信号中的言语清晰度,并且修改音频信号使得言语清晰度成为目标清晰度,目标清晰度基于与包括在音频信号中的音频类型有关的场景信息来设置,音频类型包括音效、叫喊、音乐和言语中的至少一种。
处理器还可以配置成:基于包括在音频信号中的言语信号和除该言语信号之外的非言语信号来计算言语清晰度。
处理器还可以配置成:使用训练成提取包括在音频信号中的言语信号的人工智能模型提取包括在音频信号中的言语信号,并且从音频信号中提取除所提取的言语信号之外的一个或多个剩余信号作为非言语信号。
言语清晰度可以是包括在音频信号中的言语信号和非言语信号的信噪比(SNR)以及基于言语信号和非言语信号的言语清晰度指数(SII)之一。
言语清晰度可以是SNR,并且处理器还可以配置成将言语信号的增益调整与目标清晰度和所获得的言语清晰度之间的差值一样多的值,以修改音频信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011426799.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:音频输出装置及其控制方法
- 下一篇:排气制动扭矩系统