[发明专利]一种基于手持智能终端的场景化朗读音频制作方法及系统在审
申请号: | 201711414780.4 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108536655A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 孙仉茂;纪德财 | 申请(专利权)人: | 广州市讯飞樽鸿信息技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30;G06K9/20;G10L13/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510665 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能终端 场景化 音频制作 朗读 文字内容 语音合成 背景音 获取信息 手动设置 新闻播报 信息内容 音频朗读 音频文件 用户体验 展示内容 知识传播 转换效率 自动选择 音库 音色 应用 采集 保存 融合 校园 节目 故事 军事 | ||
1.一种基于手持智能终端的场景化朗读音频制作方法,其特征在于,包括以下步骤:
S1:使用手持智能终端获取信息内容,并转化为文字格式;
S2:对文字内容进行格式化处理,包括自动分段、删除无效字符,最终获得有效的纯文本格式的内容;
S3:对文字内容的关键字进行自动识别,预判该内容的使用场景;
S4:根据预判的使用场景选择播音员音库、背景音、语速和语调;
S5:生成场景化音频文件:根据所选择的播音员音库、语速和语调,通过语音合成技术将文字内容转化为音频,并加入背景音,生成音频文件;
S6:将生成的音频文件提供给用户保存与分享。
2.根据权利要求1所述的基于手持智能终端的场景化朗读音频制作方法,其特征在于,所述手持智能终端为智能手机、iPad、平板电脑、PC电脑或智能手表。
3.根据权利要求1所述的基于手持智能终端的场景化朗读音频制作方法,其特征在于,步骤S1中,获取信息内容的途径包括以下四种方式:
通过文档文件导入,支持但不限于TXT、WORD、PPT、PDF文件;
通过输入网页URL链接,自动识别与抓取文字内容;
通过手持智能终端在海报、杂志、报纸、电脑、平板媒介上展示的文字、图片、视频等内容进行拍照,通过OCR技术获取文字内容;
通过编辑框录入内容,支持手动编辑文字,或复制文字后粘贴在编辑框中。
4.根据权利要求1所述的基于手持智能终端的场景化朗读音频制作方法,其特征在于,步骤S3中,所述使用场景包括但不限于新闻播报、军武介绍、故事文摘、校园广播。
5.根据权利要求1所述的基于手持智能终端的场景化朗读音频制作方法,其特征在于,步骤S4具体包括:
S4.1:选择播音员音库:根据预判的使用场景自动选择或手动选择音库音色;
S4.2:选择背景音:根据预判的使用场景自动选择或手动选择背景音;
S4.3:选择语速、语调:根据预判的使用场景自动选择或手动选择朗读语速、语调。
6.根据权利要求1所述的基于手持智能终端的场景化朗读音频制作方法,其特征在于,步骤S6具体包括以下方式:
邮件发送:用户可输入邮箱地址,系统自动将相关内容与文件发送至用户邮箱;
直接下载到本地:用户可在终端界面直接下载音频文件到终端设备中;
社交工具发送音频文件:通过调用用户的微信、QQ、微博等社交工具进行分享,将音频文件发送给好友、群组,以及在朋友圈、个人空间分享;
社交工具分享音频信息:通过调用用户的微信、QQ等社交工具,将音频信息存储在后台服务端,生成分享卡片发送给好友,或生成二维码发送给好友,好友可通过二维码查看与下载;
网盘存储:通过调用用户的百度网盘、360云盘第三方云存储服务,将音频文件存储在互联网网络存储空间。
7.一种基于手持智能终端的场景化朗读音频制作系统,其特征在于,包括手持智能终端和云服务端,所述云服务端包括文本格式智能处理模块、场景智能识别模块、播音员音库选择模块、背景音选择模块、语速/语调选择模块和场景化音频文件生成模块;
所述手持智能终端获取信息内容,转化为文字格式并上传到云服务器端;云服务器端的文本格式智能处理模块对文字内容进行格式化处理,包括自动分段、删除无效字符,最终获得有效的纯文本格式的内容;场景智能识别模块对文字内容的关键字进行自动识别,预判该内容的使用场景;场景智能识别模块、播音员音库选择模块、背景音选择模块分别根据预判的使用场景选择播音员音库、背景音、语速和语调;场景化音频文件生成模块根据所选择的播音员音库、语速和语调,通过语音合成技术将文字内容转化为音频,并加入背景音,生成音频文件;手持智能终端接收将生成的音频文件提供给用户保存与分享。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市讯飞樽鸿信息技术有限公司,未经广州市讯飞樽鸿信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711414780.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:识别文本展示方法及装置
- 下一篇:基于WFST的文本正则化方法及系统