[发明专利]音频编码中的帧元素长度传输有效

申请号：	201280023577.3	申请日：	2012-03-19
公开（公告）号：	CN103562994A	公开（公告）日：	2014-02-05
发明（设计）人：	马克斯·诺伊恩多夫;马库斯·穆尔特鲁斯;斯特凡·德勒;海科·普尔哈根;弗兰斯·德邦特	申请（专利权）人：	弗兰霍菲尔运输应用研究公司;杜比国际公司;皇家飞利浦股份有限公司
主分类号：	G10L19/04	分类号：	G10L19/04;G10L19/16
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	杜诚;贾萌
地址：	德国***	国省代码：	德国;DE
权利要求书：	查看更多	说明书：	查看更多
摘要：	通过如下布置可以更高效地传输将成为可用于跳过的帧元素：在配置块内分开传输默认有效载荷长度信息，其中在帧元素内的长度信息转而被细分成默认有效载荷长度标记，如果该默认有效载荷长度标记没有被设定则其后面跟随对相应帧元素的有效载荷长度明确进行编码的有效载荷长度值。然而，如果该默认有效载荷长度标记被设定，则可以避免该有效载荷长度的明确传输。更确切地，默认扩展有效载荷长度标记被设定的任何帧元素具有默认有效载荷长度，而默认扩展有效载荷长度标记未被设定的任何帧元素具有与有效载荷长度值相对应的有效载荷长度。通过该措施，提高了传输效率。
搜索关键词：	音频编码中的元素长度传输
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种比特流，包括配置块（28）和帧（20）序列，所述帧（20）分别表示音频内容（10）的连续时间周期（18），其中，所述帧（20）序列为N个帧元素（22）序列的合成，其中每个帧元素（22）具有多个元素类型中的相应一个类型，使得每个帧（20）分别包括所述N个帧元素（22）序列中的一个帧元素（22），并且对于每个帧元素（22）序列，所述帧元素（22）相对于彼此具有相等的元素类型，其中，针对所述帧元素（22）序列中的至少一个帧元素序列，所述配置块（28）包括关于默认有效载荷长度的默认有效载荷长度信息（60），以及其中，所述帧元素（22）序列中的所述至少一个帧元素序列的每个帧元素（22）包括长度信息（58），其中至少针对所述帧元素（22）序列中的所述至少一个帧元素序列的帧元素（22）子集，所述长度信息（58）包括默认有效载荷长度标记（64），其中如果所述默认有效载荷长度标记（64）没有被设定，则所述默认有效载荷长度标记（64）后面跟随有有效载荷长度值（66），其中，在其默认扩展有效载荷长度标记（64）被设定的情况下，所述帧元素（22）序列中的所述至少一个帧元素序列的任何帧元素均具有默认有效载荷长度，且在没有设定其默认扩展有效载荷长度标记（64）的情况下，所述帧元素（22）序列中的所述至少一个帧元素序列的任何帧元素均具有与所述有效载荷长度值（66）相对应的有效载荷长度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司;杜比国际公司;皇家飞利浦股份有限公司，未经弗兰霍菲尔运输应用研究公司;杜比国际公司;皇家飞利浦股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201280023577.3/，转载请声明来源钻瓜专利网。

上一篇：金融商品的随选区间价格显示方法及系统
下一篇：应用于智慧型通讯装置的即时交易方法及其交易平台

同类专利

使用失配频率范围的高频带信号译码-201580033935.2
发明人：文卡特拉曼·S·阿提;文卡特什·克里希南 -专利权人：高通股份有限公司
申请日： 2015-06-26 - 公布日： 2019-11-12 - 主分类号： G10L19/04
摘要：一种方法包含产生对应于音频信号的高频带部分的第一分量的第一信号。所述第一分量具有第一频率范围。所述方法包含产生对应于所述音频信号的所述高频带部分的第二分量的高频带激励信号。所述第二分量具有不同于所述第一频率范围的第二频率范围。将所述高频带激励信号提供至具有基于所述第一信号所产生的滤波器系数的滤波器，以产生所述音频信号的所述高频带部分的合成版本。

基于代理模型Volterra建模的语音信号编码和解码方法-201810142277.6
发明人：张玉梅;刘江山;吴晓军;吴霞 -专利权人：陕西师范大学
申请日： 2018-02-11 - 公布日： 2019-06-25 - 主分类号： G10L19/04
摘要：一种基于代理模型Volterra建模的语音信号编码和解码方法，由对输入的混沌语音信号进行预处理、用Volterra建模方法构建预测模型、确定混沌语音信号预测模型并编码、解码步骤组成。由于本发明采用对现有的人工蜂群算法进行了改进，对输入的混沌语音信号进行预加重、加窗、分帧预处理，建立了混沌语音信号预测模型，确定混沌语音信号预测模型中的参数，完成混沌语音信号的编码，根据已有编码后的数据，按照常规方法进行解码。本发明利用语音信号的混沌特点，快速准确地实现了对混沌语音信号进行编码、解码，具有步骤简单、容易实现、准确率高等优点，可用于对混沌语音信号进行编码、解码。

一种通信终端间进行语音加密通信的系统及方法-201811266278.8
发明人：王秉玉;王睿;崔爱东 -专利权人：王秉玉
申请日： 2018-10-29 - 公布日： 2019-02-15 - 主分类号： G10L19/04
摘要：本发明涉及一种通信终端间进行语音加密通信的系统及方法，解决的是存在削弱和切断处理，导致接收端不能正确解调的技术问题，通过采用包括与移动终端的音频接口依次连接的第一语音编解码器、应用处理器及第二语音编解码器，所述第二语音编解码器连接到通信终端；所述应用处理器包括与第一语音编解码器依次连接的降噪模块，语音特征提取/合成模块，加密解密模块以及调制解调模块；所述调制解调模块用于对压缩后的数据流进行调制，对加密后的数据流进行解调，调制后的数据流能够穿越语音信道的技术方案，较好的解决了该问题，可用于语音通信技术中。

语音通信方法及装置-201310503667.9
发明人：詹建飞;刘霖 -专利权人：中国移动通信集团公司
申请日： 2013-10-23 - 公布日： 2018-06-01 - 主分类号： G10L19/04
摘要：本发明提出语音通信方法及装置。方法包括：对于任一用户，用户终端采集该用户发出的语音信号，对采集的语音信号进行采样，每个采样样本作为一个训练样本；用户终端对该用户的训练样本进行训练，得到该用户的音色合成数据：目标线型滤波器系数和目标噪声序列；用户终端将该用户的音色合成数据同步到其他终端上；当所述用户与其他用户通信时，所述用户终端从该用户发出的语音信号中提取出基频信号，将该基频信号发送给对端用户终端，对端用户终端根据该用户的音色合成数据，由该基频信号计算得到该用户的原始语音信号。本发明提高了终端的语音通信质量。

一种实时语音通信的清晰度增强方法及系统-201710841920.X
发明人：胡瑞敏;李罡;程枫;王晓晨 -专利权人：武汉大学
申请日： 2017-09-18 - 公布日： 2018-01-09 - 主分类号： G10L19/04
摘要：本发明属于语音信号处理与通信技术领域，公开了一种实时语音通信的清晰度增强方法及系统，系统包括语音信号修正模块、噪声波形抵消模块、综合调整模块。方法包括获取感知参数、语音信号和噪声信号，对语音信号进行修正处理，得到已修正语音信号；获取噪声信号，对噪声信号进行噪音波形抵消处理，得到预测噪声信号；对已修正语音信号和预测噪声信号进行综合调整，得到清晰度增强信号。本发明解决了现有技术中语音清晰度提升不足的问题，达到了在实现语音清晰度增强的同时，最大程度地降低系统硬件成本的技术效果。

一种基于混沌时间序列预测模型的语音信号编码和解码方法-201610996909.6
发明人：吴晓军;张其进;张玉梅;路纲 -专利权人：陕西师范大学
申请日： 2016-11-11 - 公布日： 2017-05-31 - 主分类号： G10L19/04
摘要：本发明提供了一种基于混沌时间序列预测模型的语音信号编码和解码方法，其是通过在输入混沌语音信号中确定分析帧，对帧进行预处理，利用混沌时间序列预测模型及待编码样本，确定模型参数，提出了一种基于混沌时间序列的预测模型，利用差分动态粒子群算法确定模型的系数以及待编码样本，获取需要编码的混沌时间序列的编码数据；利用预测模型及编码数据进行解码，根据语音不同，利用求取到的该语音的最适嵌入维和最适延时时间，利用预测模型以及混沌时间序列的状态转移关系，对混沌时间序列进行解码，获得解码样本数据根据解码的数据获取到解码的样本数据；本发明不仅能够准确预测，还具有运行效率高，时间复杂度低，应用范围广，适应性强的特点。

音频编码方法及相关装置-201410177838.8
发明人：王喆 -专利权人：华为技术有限公司
申请日： 2014-04-29 - 公布日： 2017-04-12 - 主分类号： G10L19/04
摘要：本发明实施例本发明实施例提供了一种音频编码方法以及相关装置。一种音频编码方法，包括估计当前音频帧的参考线性预测效率；确定与上述当前音频帧的参考线性预测效率匹配的音频编码方式；按照与上述当前音频帧的参考线性预测效率匹配的音频编码方式对上述当前音频帧进行音频编码。本发明实施例提供的技术方案有利于降低音频编码的开销。

高频带信号的预测方法、编/解码设备-201310033625.3
发明人：刘泽新;苗磊;齐峰岩 -专利权人：华为技术有限公司
申请日： 2013-01-29 - 公布日： 2017-02-22 - 主分类号： G10L19/04
摘要：本发明实施例提供一种高频带信号的预测方法、编/解码设备。该方法包括获取音频信号的信号类型和低频带信号；所述音频信号包括低频带信号和高频带信号；根据所述信号类型获取高频带信号的频域包络；根据所述低频带信号预测高频带信号的激励信号；根据所述高频带信号的频域包络和所述高频带信号的激励信号恢复高频带信号。本发明实施例的技术方案，能够有效地减少预测得到的高频带信号与真实的高频带信号之间存在的误差，提高预测的高频带信号的准确率。

语音信号带宽扩展装置及方法-201310069828.8
发明人：张勇;刘轶 -专利权人：深港产学研基地;深港产学研基地产业发展中心
申请日： 2013-03-05 - 公布日： 2017-02-22 - 主分类号： G10L19/04
摘要：本发明公开了一种语音信号带宽扩展装置，该装置在进行语音信号带宽扩展时，利用余弦平移调制法生成全频带宽带激励信号、使用隐马尔科夫模型估计宽带谱包络参数。该装置降低了重建宽带信号的谱失真，并保证了重建宽带信号频谱的连贯性。同时，本发明还公开了一种语音信号带宽扩展方法。

一种音频编码方法和装置-201410426046.X
发明人：刘泽新;王宾;苗磊 -专利权人：华为技术有限公司
申请日： 2014-08-26 - 公布日： 2016-01-06 - 主分类号： G10L19/04
摘要：本发明实施例公开了一种音频编码方法和装置，包括：对于音频中的每一音频帧，确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时，根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重；确定所述音频帧与所述前一音频帧的信号特性不满足预设修正条件时，确定第二修正权重；所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近；根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正；根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。本发明能够在码率不变或者码率变化不大的情况下编码带宽更宽的音频，且音频帧间频谱更为平稳。

一种基于前后向联合估计的丢帧差错隐藏方法及系统-201310747005.6
发明人：许云峰;王彦 -专利权人：联芯科技有限公司
申请日： 2013-12-30 - 公布日： 2015-07-01 - 主分类号： G10L19/04
摘要：本发明提供一种基于前后向联合估计的丢帧差错隐藏方法及系统，包括缓存已经播放的两帧语音数据和将要播放的六帧语音数据；当检测到发生丢帧时，根据丢帧前的语音数据向后估计还原丢帧语音数据；根据丢帧后的语音数据向前估计还原丢帧语音数据；根据向后估计还原丢帧的语音数据和向前估计还原丢帧的语音数据进行交叉衰减生成丢失的语音估计复原信号。本发明利用语音短时平稳特点，根据丢帧前后的语音信息对丢帧进行联合估计，能更准确的估计出丢失的语音帧，对丢帧的补偿更加准确。

频带扩展的方法及装置-201310444398.3
发明人：刘泽新;苗磊;王宾 -专利权人：华为技术有限公司
申请日： 2013-09-26 - 公布日： 2015-04-15 - 主分类号： G10L19/04
摘要：本发明实施例提出了频带扩展的方法及装置。其中，频带扩展的方法包括：获取扩频参数，所述扩频参数包括以下参数中的一个或多个：线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献；根据所述扩频参数，对解码得到的低频信号进行频带扩展，以获得高频信号。本发明实施例利用扩频参数及通过扩频参数计算得到的修正因子来对解码得到的低频信号进行频带扩展，从而恢复高频信号。通过本发明实施例的频带扩展的方法及装置恢复的高频信号接近原始高频信号，质量理想。

用于自适应多速率编解码器的改进方法和设备-201180074240.0
发明人： S.布鲁恩;J.邝;J.王;C.张;S.赵 -专利权人：爱立信（中国）通信有限公司
申请日： 2011-10-18 - 公布日： 2014-09-03 - 主分类号： G10L19/04
摘要：本发明提供用于对语音信号进行编码的设备和方法。编码包括：接收语音信号的多个当前样本；从当前样本外推多个前瞻样本；以及使用当前样本和外推的前瞻样本来执行线性预测分析。

一种身份识别的方法及装置-201410173009.2
发明人：匡涛;贾魁;王勇进;任晓楠 -专利权人：海信集团有限公司
申请日： 2014-04-25 - 公布日： 2014-07-23 - 主分类号： G10L19/04
摘要：本发明实施例提供了一种身份识别的方法及装置，涉及电视技术领域，用于提高用户身份识别的准确率。所述方法，包括：接收用户的语音信号；提取所述语音信号的第一参数；分别将所述第一参数与预存储的第一模型参数进行第一模型匹配，并确定出所述第一模型匹配的最大第一概率；分别将所述第一参数与预存储的第二模型参数进行第二模型匹配，并确定出所述第二模型匹配的最大第二概率；将所述最大第一概率与第一阈值进行比较，若所述最大第一概率不小于所述第一阈值，则将所述最大第二概率与所述最大第一概率进行运算；将所述运算结果与第二阈值进行比较，若所述运算结果不小于所述第二阈值，则确定所述用户为所述最大第二概率对应的用户。

一种应用于互动教学系统的声音压缩方法-201210525205.2
发明人：李宾 -专利权人：大连联达科技有限公司
申请日： 2012-12-07 - 公布日： 2014-06-11 - 主分类号： G10L19/04
摘要：本发明公开了一种应用于互动教学系统的声音压缩方法，包含：S1.使用麦克阵列采集原始的音频信号；S2.使用优化的小波变换算法对所述音频信号进行降噪；S3.对降噪后的音频信号，使用混合编码算法，完成声音的压缩。所述步骤S1中所述的麦克阵列为像素为500W以上的CMOS麦克阵列。所述步骤S3中声音的压缩格式为支持H.264编码的wma格式的声音。所述步骤S3中声音的压缩格式为支持Xvid编码的mp3格式的声音。由于采用了上述技术方案，本发明提供的一种应用于互动教学系统的声音压缩方法，通过使用改进的小波降噪方法和优秀的声音压缩算法，可以在保证声音质量的情况下，将声音压缩的尽可能的小。

基于压缩感知和稀疏表示的语音编码方法-201410026207.6
发明人：杨震;李尚靖 -专利权人：南京邮电大学
申请日： 2014-01-21 - 公布日： 2014-05-07 - 主分类号： G10L19/04
摘要：本发明公开了一种压缩感知框架下的语音编码方法，利用压缩感知框架下行阶梯矩阵投影后观测序列可保留部分语音特性的特点，采用稀疏表示对观测序列进行数学模型建立；在训练阶段，先利用K奇异值分解方法对大量语音行阶梯投影后的观测序列进行训练，得到一个可用于实时观测序列稀疏表示的码本字典；在编码阶段，利用字典内的原子，采用正交匹配追踪算法对实时观测序列数学建模，仅对少量选择原子的位置和幅度进行编码并传输；解码端只需有相同字典就可恢复观测序列，并利用基追踪算法重构语音信号，后置低通滤波器提高重构语音的人耳听觉特性。该发明可以在压缩感知框架下有效地对语音信号进行编码传输，降低编码传输码率，并且保证良好的重构语音性能。

基于高斯混合模型的感知域音频编码方法及系统-201410057260.2
发明人：高戈;陈怡;吕亚平;张康;杨玉红 -专利权人：武汉大学
申请日： 2014-02-20 - 公布日： 2014-04-30 - 主分类号： G10L19/04
摘要：本发明公开了一种基于高斯混合模型的感知域音频编码方法和系统，包括步骤：步骤1，采用听觉滤波器对输入音频信号进行滤波，获得子带信号；步骤2，提取子带信号的希尔伯特包络，对希尔伯特包络进行平滑滤波，获得子带信号谱包络；步骤3，采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值，根据绝对掩蔽阈值对子带信号谱包络进听觉行阈值判别；步骤4，采用多路复用掩蔽模型替换子带信号谱包络；步骤5，采用采用高斯-牛顿算法对子带信号谱包络进行高斯混合模型参数拟合；步骤6，量化和编码拟合后的高斯混合模型参数。本发明可应用于高质量的中低码率语音编码，能大大降低编码码率。

音频编码中的帧元素长度传输-201280023577.3
发明人：马克斯·诺伊恩多夫;马库斯·穆尔特鲁斯;斯特凡·德勒;海科·普尔哈根;弗兰斯·德邦特 -专利权人：弗兰霍菲尔运输应用研究公司;杜比国际公司;皇家飞利浦股份有限公司
申请日： 2012-03-19 - 公布日： 2014-02-05 - 主分类号： G10L19/04
摘要：通过如下布置可以更高效地传输将成为可用于跳过的帧元素：在配置块内分开传输默认有效载荷长度信息，其中在帧元素内的长度信息转而被细分成默认有效载荷长度标记，如果该默认有效载荷长度标记没有被设定则其后面跟随对相应帧元素的有效载荷长度明确进行编码的有效载荷长度值。然而，如果该默认有效载荷长度标记被设定，则可以避免该有效载荷长度的明确传输。更确切地，默认扩展有效载荷长度标记被设定的任何帧元素具有默认有效载荷长度，而默认扩展有效载荷长度标记未被设定的任何帧元素具有与有效载荷长度值相对应的有效载荷长度。通过该措施，提高了传输效率。

在预测编码与变换编码之间交替的低延迟声音编码-201180068351.0
发明人： S.拉格特;B.科维西;P.伯塞特 -专利权人：法国电信公司
申请日： 2011-12-20 - 公布日： 2013-11-06 - 主分类号： G10L19/04
摘要：本发明涉及一种用于对数字信号进行编码的方法，包括以下步骤：根据预测编码处理对数字信号的样本的前一帧进行编码（E601），以及根据变换编码处理对数字信号的样本的当前帧进行编码（E603）。该方法实现为使得还通过相对于前一帧的预测编码受限的预测编码，通过重用前一帧的预测编码的至少一个参数并且通过仅对当前帧的第一部分的未重用参数进行编码，对当前帧的所述第一部分进行编码（E602）。本发明还涉及一种对应于描述的编码方法的解码方法。本发明进一步涉及分别实现描述的编码和解码方法的编码器和解码器。

线性预测语音编码方法及语音合成方法-201210592909.1
发明人：洪小斌 -专利权人：北京迅光达通信技术有限公司
申请日： 2012-12-31 - 公布日： 2013-04-17 - 主分类号： G10L19/04
摘要：本发明公开了一种线性预测语音编码方法及一种语音合成方法。所述语音编码方法包括：对语音进行预处理；对预处理后的语音进行二阶反线性预测，得到残差信号；对残差信号进行小波分解压缩，得到小波系数，并对小波系数进行矢量量化，同时，计算残差信号的基音周期、增益参数及各子带的清浊音特性并分别进行标量量化。所述语音合成方法基于所述语音编码方法。采用本发明的技术方案，能够减小噪声对解码语音质量的影响，抑制清浊音判决错误时的音质恶化，并改善对清音语音或背景噪声的编码性能。

一种线性预测分析方法、装置及系统-201210462237.2
发明人：许剑峰;苗磊;齐峰岩;张德军;张清 -专利权人：华为技术有限公司
申请日： 2009-03-11 - 公布日： 2013-02-13 - 主分类号： G10L19/04
摘要：本发明公开了一种线性预测分析方法、装置及系统，涉及通信领域，能够提高线性预测编码的预测性能，并且分析运算复杂度低。解决方案为：获取输入信号至少一个样点的信号特性信息；对所述信号特性信息进行比较分析，得到分析结果；根据所述分析结果选择窗函数对所述输入信号进行自适应加窗，得到加窗后信号；对所述加窗后信号进行处理，得到线性预测编码系数用于线性预测。本发明用于线性预测编码。

用于对高频信号进行编码和解码的方法和设备-201210356808.4
发明人：朱基岘;苗磊;吴殷美 -专利权人：三星电子株式会社
申请日： 2007-11-19 - 公布日： 2013-02-06 - 主分类号： G10L19/04
摘要：提供了一种通过使用低频信号来对高频信号进行编码和解码的方法和设备。可通过下述操作来对高频信号进行编码，所述操作包括：通过对高频信号进行线性预测来提取系数，并对所述系数进行编码；通过使用提取的系数和低频信号来产生信号；通过计算高频信号的能量值和产生的信号的能量值之间的比来对高频信号进行编码。此外，可通过下述操作来对高频信号进行解码，所述操作包括：对通过对高频信号进行线性预测而提取的系数和低频信号进行解码，并通过使用解码的系数和解码的低频信号来产生信号；通过对产生的信号的能量值和高频信号的能量值之间的比进行解码来调节产生的信号。

一种采用高阶线性预测系数分组矢量量化的语音编解方法-201210334612.5
发明人：殷福亮;陈喆;汪林;张旭 -专利权人：大连理工大学
申请日： 2012-09-10 - 公布日： 2013-01-09 - 主分类号： G10L19/04
摘要：本发明公开了一种采用高阶线性预测系数分组矢量量化的语音编解方法，其能够应用于低码率、高质量语音编解码器中，能够减少对高阶线谱频率矢量量化所需的码本体积和计算量。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频编码中的帧元素长度传输有效

专利文献下载