[发明专利]基于声纹信息对音频/视频文件进行操作的方法及装置有效
| 申请号: | 201210518118.4 | 申请日: | 2012-12-05 |
| 公开(公告)号: | CN103035247B | 公开(公告)日: | 2017-07-07 |
| 发明(设计)人: | 杨帆;苏腾荣;李世全;马永健 | 申请(专利权)人: | 北京三星通信技术研究有限公司;三星电子株式会社 |
| 主分类号: | G10L17/22 | 分类号: | G10L17/22;G06F17/30 |
| 代理公司: | 北京市立方律师事务所11330 | 代理人: | 郑瑜生 |
| 地址: | 100125 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 声纹 信息 音频 视频文件 进行 操作 方法 装置 | ||
技术领域
本发明涉及移动设备通信应用领域,尤其涉及根据特定联系人声纹对终端设备音视频操作的方法及装置。
背景技术
现有终端设备上的录音器或摄像器可以方便用户录制和拍摄音频和视频文件。随着终端设备的性能提高,存储容量增大,多媒体应用程序的种类增多等条件,用户很容易录制或拍摄大量的音频/视频文件。然而,面对着大量音频/视频文件,当用户需要查找所有录制有某个特定联系人的音频/视频文件,或查找和播放某个特定联系人在某个音频/视频文件中的某一段特定信息时,由于无法快速定位,会遇到无从查找的情况。只有一个一个文件的播放查看,才能得到所需文件或片段。
有鉴于此,需要提供一种快速查找和分类目标音频/视频文件,并定位特定联系人在该文件中出现时间点的方法和终端设备,以方便用户查找录制有特定人员声音和视频的文件。
发明内容
为了解决上述技术问题,实现用户快速查找录制有特定人员声音或视频的文件。
本发明的目的之一在于提供一种基于声纹信息对音/视频文件进行操作的方法,包括如下步骤:采集发声目标的声纹信息;以及根据所述声纹信息搜索音/视频文件;其中,所述音/视频文件中的所有被录制的声音被分割为多个语音单元,每个语音单元只包含其中一个发声目标的语音,并记录所述发声目标在所述音/视频文件中的时间点。
本发明的另一目的在于提供一种终端设备,包括:声纹提取模块,用于采集发声目标的声纹信息;以及执行模块,用于根据所述声纹信息搜索音/视频文件;其中,所述音/视频文件中的所有被录制的声音被分割为多个语音单元,每个语音单元只包含其中一个发声目标的语音,并记录所述发声目标在所述音/视频文件中的时间点。
本发明提供的方法和装置,能够快速查找录制有特定人员声音或视频的文件,以提高用户的搜索效率。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施方法的描述中将变得明显和容易理解,其中:
图1示出了根据本发明一实施例的流程示意图;
图2示出了根据本发明的一实施例的终端设备进行音频采集之前的界面示意图;
图3示出了根据本发明实施例的音频采集的流程图;
图4示出了根据本发明的一实施例的终端设备进行音频采集时的界面示意图;
图5示出了搜索出录制的视频和音频文件后终端设备显示出在文件中标注有发声目标的声纹信息出现和/或结束的时间点的界面示意图;
图6示出了根据本发明的一实施例的通过终端设备查看联系人媒体库的流程图;
图7示出了根据本发明实施例的录制联系人声音的流程图;
图8示出了根据本发明一实施例的整体结构示意图;
图9示出了根据本发明一实施例的结构示意图。
具体实施方式
现在参照附图来具体描述本发明的示例性实施方法。然而,本发明可以用许多不同形式来实施并且不应该认为局限于这里阐述的具体实施方法;相反,提供这些实施方法是为了使本发明的公开彻底和完整,并向本领域技术人员完整地传达本发明的思想、观念、目的、构思、参考方案和保护范围。附图中示例的具体示例性实施方法的详细描述中使用的术语并不是为了限制本发明。附图中,相同标号指代相同要素。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210518118.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种录音机
- 下一篇:基于智能手机的出租车自动寻呼系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





