[发明专利]一种云会议云翻译方法及系统在审
申请号: | 202011248791.1 | 申请日: | 2020-11-10 |
公开(公告)号: | CN112380878A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 程世强;顼华伟 | 申请(专利权)人: | 在线场景(北京)科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F16/36;G06F16/33;G06K9/62;G06N3/04;G06N3/08;G10L25/03;G10L25/24;G10L25/27;G10L25/30 |
代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 代述波 |
地址: | 100000 北京市朝阳区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 会议 翻译 方法 系统 | ||
1.一种云会议云翻译方法,其特征在于,包括:
采用语谱图作为源语句并输入至Encoder;
指示从Encoder到Decoder转换的边界标记和目标句子为系统提供张量,包含单词索引源输入字、目标输入字、目标输出字;
对齐关联句子顺序向左移动分解词源,向左移动一个时间段并再右边附加一个句末尾标记;
通过已标标记源语言和目标语言的句子对,引用注意力机制将源语言投影至目标语言。
2.如权利要求1所述的一种云会议云翻译方法,其特征在于,所述语谱图的获取方法包括:
通过语音信号获得语谱图和声学特征描述符LLD,对声学特征描述符特征进行HSF表示,获取切分后的音频文件的全局特征。
3.如权利要求2所述的一种云会议云翻译方法,其特征在于,还包括:
语谱图输入馈入卷积神经网络中作为一条通道;
语谱图和梅尔频率倒谱系数馈入Sequence-to-Sequence中作为另一条通道,将两条通道的模型融合加入注意力机制,形成声纹识别特征。
4.如权利要求1所述的一种云会议云翻译方法,其特征在于,所述从Encoder到Decoder转换的方法包括:
查找源语句并进行目标降维,以检索相应的词表示,为每种语言选择一个词汇表,每种语言一套降维权重;
当检索到相关词语时,将词语降维作为输入馈送到两个多层向量神经网络组成源语言的Encoder以及用于目标语言的Decoder。
5.如权利要求4所述的一种云会议云翻译方法,其特征在于,还包括:
训练中梯度剪切以Adam做为优化器并预设学习率,形成编码参数序列文件,为Decoder提供解码所需数据支持。
6.如权利要求1所述的一种云会议云翻译方法,其特征在于,所述通过已标标记数据的源语言和目标语言的句子对,引用注意力机制将源语言投影至目标语言包括:
第一Sequence-to-Sequence模型输入为已标标记数据的源语言句子,通过深度模型源语言句子得到一个高维空间的向量;
第二Sequence-to-Sequence模型以第一个Sequence-to-Sequence模型输出的高维空间的向量为输入,逐渐解码目标语言句子。
7.如权利要求6所述的一种云会议云翻译方法,其特征在于,还包括:
注意力机制通过对目标语言Encoder与源语言的词之间的相似度,得到哪些源语言需要得到更多的关注;
得到更多关注的源语言的词会在Encoder过程中加以更大的权重。
8.如权利要求7所述的一种云会议云翻译方法,其特征在于,还包括:
对不同语言提取特征训练一个语言分类器,通过语言分类器判断用户输入的文本属于哪个语言。
9.一种云会议云翻译系统,其特征在于,包括:
编码模块,用于采用语谱图作为源语句并输入至Encoder;
解码模块,用于指示从Encoder到Decoder转换的边界标记和目标句子为系统提供张量,包含单词索引源输入字、目标输入字、目标输出字;
标记模块,用于对齐关联句子顺序向左移动分解词源,向左移动一个时间段并再右边附加一个句末尾标记;
输出模块,用于通过已标标记源语言和目标语言的句子对,引用注意力机制将源语言投影至目标语言。
10.如权利要求9所述的一种云会议云翻译系统,其特征在于,包括:
用于存储计算机指令的至少一个存储器;
与所述存储器通讯的至少一个处理器,其中当所述至少一个处理器执行所述计算机指令时,所述至少一个处理器使所述系统执行:编码模块、解码模块、标记模块以及输出模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于在线场景(北京)科技有限公司,未经在线场景(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011248791.1/1.html,转载请声明来源钻瓜专利网。