[发明专利]一种带个性化语音实现方法及其平台在审
| 申请号: | 201811052828.6 | 申请日: | 2018-09-10 |
| 公开(公告)号: | CN109302339A | 公开(公告)日: | 2019-02-01 |
| 发明(设计)人: | 严瑾 | 申请(专利权)人: | 郭素英 |
| 主分类号: | H04L12/58 | 分类号: | H04L12/58;G10L15/22;G10L15/04;G10L15/25;G10L21/0208;G10L25/63;G10L13/08 |
| 代理公司: | 北京智乾知识产权代理事务所(普通合伙) 11552 | 代理人: | 王雪静 |
| 地址: | 476600 河南省*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 表情 特征变化 用户语音信息 个性化语音 面部表情 语音信息 语音 输出带 合成 分析单元 合成单元 获取单元 生成单元 输出单元 互动性 展示 分析 情绪 创作 | ||
本发明涉及一种带个性化语音实现方法及其平台,所述方法包括(1)通过平台获取用户语音信息;(2)分析语音信息的特征变化;(3)根据所述特征变化生成对应的表情帧或结合已创作流行的表情包;(4)平台将声音信号加面部表情或声音信号与平台中的表情进行合成;(5)输出带语音的表情包。所述平台包括获取单元:用于获取用户语音信息;分析单元:用于分析语音信息的特征变化;生成单元:用于根据所述特征变化生成对应的表情帧;合成单元:用于将声音信号和面部表情与平台中的表情进行合成;输出单元:用于输出带语音的表情包。本发明带语音的表情展示,可以准确地根据用户的情绪展示表情,增强了用户的互动性和实用性,进而提高了用户的体验度。
技术领域
本发明涉及实用工具技术领域,具体涉及一种带个性化语音实现方法及其平台。
背景技术
通常表情符号都以文本或图像的形式表示用户的感受,目前,表情符号可具有快闪图像或电影的形式。这些表情符号基本上用在在其中发送方和接收方传输和接收文本的环境中并且主要用于表达通信者的感受而不是用于递送信息。
这些表情符号基于文本或图像产生并被提供给接收方的便携式终端,但是用户的感受可不仅利用图像形式而且作为语音或声音来表达。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种带个性化语音实现方法及其平台。
本发明的目的是采用下述技术方案实现的:
一种带个性化语音实现方法,其改进之处在于,所述方法包括
(1)通过平台获取用户语音信息;
(2)分析语音信息的特征变化;
(3)根据所述特征变化生成对应的表情帧或结合已创作流行的表情包;
(4)平台将声音信号加面部表情或声音信号与平台中的表情进行合成;
(5)输出带语音的表情包。
进一步的,所述步骤(2)包括将所述语音信息分割为多个语音片段,计算出基本发音的权重,获取所述语音片段的特征。
进一步的,所述步骤(3)中根据所述特征变化生成对应的表情帧包括根据所述特征变化生成对应的面部表情,根据所述面部表情生成对应的表情帧,根据所述表情帧生成动画表情。
进一步的,所述根据所述特征变化生成对应的面部表情包括对获取的所述特征变化进行滤波处理,得到滤波后的语音信号;根据相等声波,中和所述滤波后的语音信号进行去燥处理,得到声音信号;将所述声音信号转化为对应的面部表情。
进一步的,所述步骤(4)包括平台根据有效的声音信号加面部表情或声音信号与平台表情素材库中的表情进行合成,通过分类器进行表情素材的选择并融合,生成对应的新表情素材,逐帧呈现为带语音的动态表情;其中,平台表情素材库中的表情包括原始形态表情和已创作流行的表情包。
进一步的,所述步骤(5)将带语音的动态表情通过平台人机交互生成带语音的表情包并输出至用户。
本发明基于另一目的还提供一种带个性化语音实现平台,其改进之处在于,所述平台包括:
获取单元:用于获取用户语音信息;
分析单元:用于分析语音信息的特征变化;
生成单元:用于根据所述特征变化生成对应的表情帧或结合已创作流行的表情包;
合成单元:用于将声音信号加面部表情或声音信号与平台中的表情进行合成;
输出单元:用于输出带语音的表情包。
进一步的,将所述语音信息分割为多个语音片段,计算出基本发音的权重,获取所述语音片段的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郭素英,未经郭素英许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811052828.6/2.html,转载请声明来源钻瓜专利网。





