[发明专利]用于文本至语音递送的设备及用于文本至语音递送的方法无效

申请号：	200780052676.3	申请日：	2007-03-21
公开（公告）号：	CN101669166A	公开（公告）日：	2010-03-10
发明（设计）人：	罗里·琼斯;斯文·尤尔根斯	申请（专利权）人：	通腾科技股份有限公司
主分类号：	G10L13/00	分类号：	G10L13/00;G01C21/36;G08G1/0968
代理公司：	北京律盟知识产权代理有限责任公司	代理人：	刘国伟
地址：	荷兰阿***	国省代码：	荷兰;NL
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于文本语音递送设备方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明关乎到一种用于文本至语音(TTS)递送的设备及方法。

背景技术

TTS软件众所周知。通常，TTS引擎能够解码或解释简单的源自文本或字处理器的文档(例如，″.txt″、″.doc″等等)并将实质上是所述本文的二进制表示的内容转换成呈到达声音处理器的指令形式的替代二进制表示，所述声音处理器最终将适当的电信号递送至常规扬声器。对原始文本文档的解释(不管其是否因其仅含有短的短语或名称而离散，或其是否更庞大且含有一个或一个以上本文段落)通常可涉及粒度层级的分析(例如，辅音、元音及音节)，且还可包含语法及标点符号分析以使得借助正确词形变化及语调所产生的所得合成语音且因此声音尽可能的逼真。

一般而言，存在两种使用电子硬件及软件合成语音的方法。在并置合成中，通过并置存储于数据库中的预先记录的语音片来形成所合成的语音。系统在所存储的语音单位的大小上不同；仅存储较小单音或双音的系统将提供最大输出范围，但可能缺乏清晰度，然而存储整个字或句子允许高质量输出。另一选择为，在共振峰合成中，合成器并入声道模型及其它人类话音特性来形成完全“合成的”话音输出。参数(例如，基频、发声及噪声级)随时间变化以形成人工语音的波形。所述方法有时称为基于规则的合成；然而，许多并置系统中也具有基于规则的组件。

语音合成的一种最普通用法从其一开始一直是允许盲人或弱视人群理解书面语。新近，过多现代装置(实际上，具有相对适度的处理能力及存储器的任一装置(例如，个人数字助理(PDA))、更高级的移动电话(例如，所谓的智能电话)、游戏控制台及车内卫星导航系统(SNS)允许某一设施播放预先记录的人类话音片段或执行TTS软件以解释即时存储于所述装置上的任一经文本或字处理的文档。

本发明特别适用于车内SNS装置，且虽然以下描述几乎排他地针对车内SNS装置，但有技能的读者将容易了解，本发明的应用可具有更宽广的范围，且不应被认为受具体描述的限制。

车内SNS装置在约先前5年中已变得普遍，且大多数装置包含针对特定国家的一个或一个以上地图数据库及可能以多种不同的话音(例如，男性、女性)且以不同音调或以不同庄严或欢乐程度存储许多预先记录的短语的能力两者。此外，许多装置还准许用户按其自己的话音记录所述短语记录，且在所述装置的操作软件中可存在简单例程来教示所述用户连续地记录为所述装置的正确操作所需的每个短语。例如，可要求用户记录多种不同短语或口语片段(例如“向左转”、“向右转”、“400米后”等等)，且一旦所述记录完成，所述装置的操作软件即保证在适当时间选择所述用户的话音片段以用于重放，如与默认或先前选择的预先记录的片段相反。虽然基础较简单，但所述技术已用于移动电话方面一段时间，其中用户可记录其自己的话音且在特定人或实际上任一人向行动电话发出呼叫时用所述记录替代所述装置的默认铃声。

以上预先记录的系统通常不只是适用于大多数路线导航操作，但因其不提供用于对非标准或国家特有信息的可听识别的设施而受限。

因此，本发明的目标是克服所述缺点，且尤其为车内SNS提供更全面的音频解决方案。

发明内容

根据本发明，提供一种用于从数据产生声音的具处理器能力的装置，所述装置具有：

用于以数字方式处理声音的构件及用于所述声音的可听递送的构件

存储器，其中存储有多个数据的数据库及一个或一个以上预先记录的声音，所述多个数据中的至少一些数据是呈以基于文本的指示符形式，

数据传送构件，所述数据通过所述数据传送构件在所述装置的所述处理器与所述存储器之间传送，及

操作系统软件，其控制处理器与存储器之间的数据处理及流动以及所述声音是否以可听方式重现

所述装置进一步能够反复确定一个或一个以上物理条件，所述物理条件与存储器中提供的一个或一个以上参考值进行比较，以使得所述比较的肯定结果引起需要由所述装置产生声音的事件，

其特征在于

所述装置进一步包含与所述操作系统或其上执行的程序交互的TTS软件组件，所述操作系统或程序根据用户输入做出是否应借助以下各项以可听方式识别所述事件的确定

存储于所述装置上的一个或一个以上预先记录的声音，