[发明专利]语音处理方法及系统在审
申请号: | 201710298483.1 | 申请日: | 2017-04-30 |
公开(公告)号: | CN106910514A | 公开(公告)日: | 2017-06-30 |
发明(设计)人: | 代嘉鹏 | 申请(专利权)人: | 上海爱优威软件开发有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201203 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 系统 | ||
1.一种语音处理方法,其特征在于,包括:
获取用户的语音信息,以及用户做出上述语音信息时的面部表情信息和生理参数信息;
提取语音信息、面部表情信息和生理参数信息的相关特征值,并根据特征值生成情感标签;
根据语音信息生成语义文本信息;
将语义文本信息和情感标签合成,以文本、图片、声音、视频中的一种或几种相结合的方式输出。
2.根据权利要求1所述的语音处理方法,其特征在于,将语义文本信息和情感标签合成后,输出带有表情符号的文本。
3.根据权利要求1所述的语音处理方法,其特征在于,将语义文本信息和情感标签合成后,输出另一种语言的语音,该语音与获取的用户语音信息语义相同,且具有相同的情感特征。
4.根据权利要求1或3所述的语音处理方法,其特征在于,将语义文本信息和情感标签合成后,输出具有能够表达不同情感的表情或动作的虚拟人物的视频。
5.根据权利要求1所述的语音处理方法,其特征在于,将语义文本信息和情感标签合成后,生成与语义文本信息和情感标签对应的具有情感的对话语音。
6.根据权利要求1所述的语音处理方法,其特征在于,根据语音信息生成语义文本信息的过程,会参考情感标签。
7.根据权利要求1所述的语音处理方法,其特征在于,根据特征值生成情感标签的方法包括:
提取语音信息中的第一特征值,并根据所述第一特征值生成语音情绪指标;提取面部表情信息中的第二特征值,并根据所述第二特征值生成表情情绪指标;提取生理参数信息中的第三特征值,并根据所述第三特征值生成生理情绪指标;
根据语音情绪指标、表情情绪指标以及生理情绪指标生成情感标签。
8.根据权利要求7所述的语音处理方法,其特征在于,所述第一特征值包括基频、强度、时长、元音共振峰中的一种或几种;所述第二特征值包括面部特征的位移或形变;所述第三特征值包括心率、血氧、体温、瞳孔状态中的一种或几种。
9.一种语音处理系统,其特征在于,包括:
语音信息采集模块,用于采集用户输出的语音信息;
面部表情信息采集模块,用于采集用户输出上述语音信息时的面部表情信息;
生理参数信息采集模块,用于采集用户输出上述语音信息时的生理参数信息;
处理分析模块,所述处理分析模块的输入端分别与语音信息采集模块、面部表情信息采集模块以及生理参数信息采集模块连接,以根据语音信息、面部表情信息和生理参数信息生成情感标签和语义文本信息;
内容输出模块,所述内容输出模块与处理分析模块的输出端连接,以根据情感标签和语义文本信息,输出具有情感的语音以及虚拟人物视频。
10.根据权利要求9所述的语音处理系统,其特征在于,语音信息采集模块包括至少一个麦克风,所述面部表情信息采集模块包括至少一个摄像头,所述生理参数信息采集模块包括血氧传感器、脉搏传感器、体温传感器和瞳孔分析设备中的一种或几种;
所述处理分析模块包括语音处理器、图像处理器以及医疗信息处理器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海爱优威软件开发有限公司,未经上海爱优威软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710298483.1/1.html,转载请声明来源钻瓜专利网。