[其他]一种大规模、用户独立、装置独立的语音讯息系统无效
申请号: | 200790000022.1 | 申请日: | 2007-02-12 |
公开(公告)号: | CN201355842Y | 公开(公告)日: | 2009-12-02 |
发明(设计)人: | 丹尼尔·迈克尔·道尔顿 | 申请(专利权)人: | 斯皮沃克斯有限公司 |
主分类号: | H04M3/533 | 分类号: | H04M3/533 |
代理公司: | 北京连和连知识产权代理有限公司 | 代理人: | 张春媛 |
地址: | 英国白*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 大规模 用户 独立 装置 语音 讯息 系统 | ||
发明背景
1.技术领域
本实用新型涉及一种大规模、用户独立、装置独立的语音讯息系统, 其将无组织的语音讯息转换成文本用以显示在屏幕上。初步面对能够将无 组织的语音讯息转换成文本的大规模、用户独立的语音讯息系统的挑战, 是值得关注的。首先,“大规模”意味着该系统应该可以升级到极大量、例 如500,000+个用户(典型地,这些是移动电话运营商的用户),并且仍 然能够允许有效、快速的处理时间-讯息通常在发出后的2-5分钟内收到 才是有用的。这要求远高于大多自动语音识别ASR。第二,“用户独立”: 这意味着完全不需要用户训练系统来识别自己的声音或说话方式(不同于 传统的语音听写系统)。第三,“装置独立”:这意味着系统系统不受从特 定的输入装置接收输入的束缚;某些已有技术的系统需要来自按键式电话 机的话语输入。第四,“无组织”:这意味着讯息没有预先确定的结构,不 像对语音提示的反应。第五,“语音讯息”:这是非常特定并且极窄应用的 领域,其对许多传统的自动语音识别(automated speech recognition,ASR) 系统所面临的挑战提出了不同的挑战。例如,用于移动电话的语音邮件讯 息通常包括停顿、“呃”和“嗯”。传统的ASR方法将忠实地转换所有的言语, 甚至是毫无意义的声音。精确或冗长转录的思维是大多数ASR领域人士 的方法的特征。但是,事实上这对语音讯息领域来说根本不适当。在语音 讯息领域,需要解决的问题根本不是精确、冗长的转录,而是对接收者以 最有用的方式获取涵义。
只有通过成功地达到以上五个要求,才有可能得到成功的实现。
2.已有技术的说明
传统的语音-文本(speech-to-text,STT)转化利用自动语音识别 (ASR),迄今为止,主要应用于听写和指令任务。ASR技术用于将语音 向文本转换是新的应用,具有多种任务特殊的特征。可以参照WO 2004/095821号专利文件(其内容以参考引用的方式引用于此),其公开了 一种Spinvox公司的语音邮件系统,该系统能将用于移动电话的语音邮件 转化成SMS文本并发送到移动电话。管理文本格式的语音邮件是有吸引 力的选择。通常阅读比听取讯息快,并且,一旦处于文本格式,语音邮件 就可以像电子邮件或SMS文本一样很容易地存储和检索。在一个实施例 中,SpinVox服务的用户将他们的语音邮件转移到专用的SpinVox电话号 码。呼叫者像往常一样为用户保留语音邮件讯息。SpinVox随后将讯息从 语音变为文本,旨在获取全部的涵义以及讯息的风格和惯用语素,但不必 逐字转换。转换以人工输入的显著水平进行。文本随后要么以SMS、要么 以电子邮件发送到用户。这样,用户就可以像管理文本和电子邮件讯息那 样方便快捷地管理语音邮件,并且可以使用客户应用软件将其语音邮件与 其它讯息整合,该语音邮件现在是可搜索并且可归档的文本形式。
然而,较大程度上以人工为基础的转录系统的问题在于其成本高、且 难以规模化到市场规模,例如规模化到500,000+或更多的用户基础。因此, 对主要的移动电话运营商来说,将该系统提供给他们的用户基础是不切实 际的,因为对于所需的快速反应时间来说,让人工操作员听取并转录每个 讯息的全部代价太昂贵;每个转录讯息的成本将会令人望而却步地高。因 此,基本的技术难题就是设计一种基于IT的系统,其能够使人工转录打 字员非常高效地操作。
WO 2004/095821号专利文件展望了一定程度的结合了人工操作员的 ASR前端处理:本质上其为混合系统;本发明对其进行了发展,并确定了 特定的任务,即该IT系统可以极大增加整个系统的效率。
混合系统在其它背景中已经公知,但是传统的语音转换方法要完全消 除人为的因素,这也是ASR领域、尤其是STT领域的技术人员的思维。 因此,我们现在将考虑STT的一些技术背景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯皮沃克斯有限公司,未经斯皮沃克斯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200790000022.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:液晶电视机的驱动电路
- 下一篇:大型稀土永磁电机定子铁芯