[发明专利]音频视频转换设备、音频视频转换方法以及音频视频转换程序无效

申请号：	03806570.3	申请日：	2003-03-19
公开（公告）号：	CN1643573A	公开（公告）日：	2005-07-20
发明（设计）人：	伊福部达	申请（专利权）人：	独立行政法人科学技术振兴机构;株式会社B.U.G.;伊福部达
主分类号：	G10L15/00	分类号：	G10L15/00;H04N5/278;G06F17/28
代理公司：	永新专利商标代理有限公司	代理人：	韩宏
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：	讲话者的语音被一复述人员复述，该复述人员的语音被识别且讲话者的视频在被显示时被延迟以使其连同字符一起被显示，从而该讲话者的语音可容易地被理解。视频延迟单元(2)输出被视频输入到照相机(1)且被延迟的视频数据。第一语音识别单元(5)识别输入到第一语音输入单元(3)的第一复述人员以第一语言复述的内容并将其转换成可视语言数据。第二语音识别单元(6)识别输入到第二语音输入单元(4)的第二复述人员以第二语言复述的内容并将其转换成第二可视语言数据。设置单元(8)接收来自第一和第二语音识别单元(5，6)的第一和第二语言数据和来自视频延迟单元(2)的延迟的视频数据，设置这些数据的显示布局，建立显示视频，并在一字符视频显示单元(9)上进行显示。
搜索关键词：	音频视频转换设备方法以及程序
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种音频视频转换设备，包括：照相机，用于拍摄讲话者的面部表情的图像；视频延迟单元，用于延迟照相机拍摄的图像的视频信号达预定延迟时间之久，并且用于输出延迟的视频数据；第一语音输入单元，用于接收第一复述人员依照第一语言发出的语音，所述第一复述人员复述讲话者依照第一语言发出的语音；第二语音输入单元，用于接收第二复述人员依照第二语言发出的语音，所述第二复述人员复述翻译者依照第二语言发出的语音，其中所述翻译者翻译讲话者依照第一语言发出的语音；第一语音识别单元，用于将从第一语音输入单元发送的依照第一语言发出的语音识别并且转换为第一可视语言数据，并且用于输出所述数据；以及第二语音识别单元，用于将从第二语音输入单元发送的依照第二语言发出的的语音识别并且转换为第二可视语言数据，并且用于输出所述数据；设置单元，用于接收从第一语音识别单元输出的第一可视语言数据、从第二语音识别单元输出的第二可视语言数据以及由视频延迟单元延迟的讲话者的延迟视频数据，用于确定显示状态，并且用于生成待显示的图像，其中那些数据已经同步化或者近似同步化；文本和视频显示单元，用于依照来自于设置单元的输出来显示待显示的图像，在所述图像中，第一可视语言数据、第二可视语言数据以及延迟视频数据已经同步化或者近似同步化；输入单元，用于建立一个或多个第一语音识别单元、第二语音识别单元、视频延迟单元以及设置单元；以及处理器，用于控制第一语音识别单元、第二语音识别单元、视频延迟单元、输入单元以及设置单元。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于独立行政法人科学技术振兴机构;株式会社B.U.G.;伊福部达，未经独立行政法人科学技术振兴机构;株式会社B.U.G.;伊福部达许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/03806570.3/，转载请声明来源钻瓜专利网。

上一篇：具有特定位置信息数据库的信息服务器和用于远程访问和查询的电话
下一篇：单比特游程频率的在线随机性测试

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频视频转换设备、音频视频转换方法以及音频视频转换程序无效

专利文献下载