[发明专利]面向直播场景的实时字幕翻译及系统实现方法有效

申请号：	201811523195.2	申请日：	2018-12-13
公开（公告）号：	CN109525787B	公开（公告）日：	2021-03-16
发明（设计）人：	张晖;丁一全	申请（专利权）人：	南京邮电大学
主分类号：	H04N5/278	分类号：	H04N5/278;G10L17/18;G10L17/04;G10L15/26
代理公司：	南京苏科专利代理有限责任公司 32102	代理人：	姚姣阳
地址：	210003 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明揭示了一种面向直播场景的实时字幕翻译及系统实现方法，包括如下步骤：S1、使用训练数据集训练深度卷积神经网络；S2、对输入的每帧语音进行傅里叶变换，将时间和频率作为图像的两个维度，获取输入的语音信号的语谱图；S3、将获取的语谱图输入已经训练好的深度卷积神经网络，得到与语音信号相对应的文本数据；S4、将所述文本数据实时显示在屏幕上。本发明能够对每个人的讲话进行实时翻译，并及时显示在屏幕上，从而有效地提升了转写的效率，为观众带来了更为优异的用户体验。
搜索关键词：	面向直播场景实时字幕翻译系统实现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种面向直播场景的实时字幕翻译及系统实现方法，其特征在于，包括如下步骤：S1、使用训练数据集训练深度卷积神经网络；S2、对输入的每帧语音进行傅里叶变换，将时间和频率作为图像的两个维度，获取输入的语音信号的语谱图；S3、将获取的语谱图输入已经训练好的深度卷积神经网络，得到与语音信号相对应的文本数据；S4、将所述文本数据实时显示在屏幕上。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京邮电大学，未经南京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811523195.2/，转载请声明来源钻瓜专利网。

上一篇：视频处理方法、装置、终端设备及存储介质
下一篇：一种人工智能机器人用声光信号采集转换装置及其工作原理

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N5-00 电视系统的零部件
H04N5-04 .同步
H04N5-14 .视频图像信号电路
H04N5-222 .电视演播室线路；电视演播室装置；电视演播室设备
H04N5-30 .转变光或模拟信息为电信号
H04N5-38 .发射机电路

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]面向直播场景的实时字幕翻译及系统实现方法有效

专利文献下载