[发明专利]一种智能开场白语音生成方法、装置和电子设备在审
| 申请号: | 202011171104.0 | 申请日: | 2020-10-28 |
| 公开(公告)号: | CN112349270A | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 李晴覃 | 申请(专利权)人: | 北京奇保信安科技有限公司 |
| 主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L21/013;G06K9/00 |
| 代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 喻颖 |
| 地址: | 100015 北京市朝阳区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 智能 开场白 语音 生成 方法 装置 电子设备 | ||
1.一种用于售货机的智能开场白语音生成方法,其特征在于,包括:
建立人声模型,该模型用于根据用户的生物特征计算适于该用户偏好的人声;
建立语言风格模型,该模型用于根据用户的生物特征计算适于该用户偏好的语言风格;
检测所述售货机周边预定范围是否有用户,并在有用户时获取其生物特征,基于该生物特征,使用所述人声模型和语言风格模型计算适合该用户的人声和语言风格;
根据所计算的语言风格从预定话术库中选择相应的开场白话术,并使用所计算的人声合成开场白语音。
2.根据权利要求1所述的智能开场白语音生成方法,其特征在于,所述建立人声模型包括:
建立人声模型训练数据集,该数据集中包括多条数据,每条数据包括用户的生物特征信息及该用户偏好的人声信息;
使用该人声模型训练数据集训练分类模型,以使该人声模型能根据用户的生物特征信息计算该用户所偏好的人声。
3.根据权利要求1-2中任一所述的智能开场白语音生成方法,其特征在于,
所述人声信息包括频率、振幅、音色、语速中的任一种。
4.根据权利要求1-3中任一所述的智能开场白语音生成方法,其特征在于,还包括:
建立语言风格模型训练数据集,该数据集中包括多条数据,每条数据包括用户的生物特征信息及该用户偏好的语言风格信息;
使用该语言风格模型训练数据集训练分类模型,以使该语言风格模型能根据用户的生物特征信息计算该用户所偏好的语言风格。
5.根据权利要求1-4中任一所述的智能开场白语音生成方法,其特征在于,所述语言风格信息数据包括平淡自然型、幽默风趣型、简洁洗练型、朴实无华型、辞藻华丽型和活泼可爱型。
6.根据权利要求1-5中任一所述的智能开场白语音生成方法,其特征在于,所述生物特征包括人的性别、年龄、身高、种族、民族中的至少两个。
7.根据权利要求1-6中任一所述的智能开场白语音生成方法,其特征在于,
获取用户的人脸特征,根据该人脸特征对用户的生物特征进行识别。
8.一种用于售货机的智能开场白语音生成装置,其特征在于,包括:
第一建立模块,用于建立人声模型,该模型用于根据用户的生物特征计算适于该用户偏好的人声;
第二建立模块,用于建立语言风格模型,该模型用于根据用户的生物特征计算适于该用户偏好的语言风格;
检测模块,用于检测所述售货机周边预定范围是否有用户,并在有用户时获取其生物特征,基于该生物特征,使用所述人声模型和语言风格模型计算适合该用户的人声和语言风格;
计算合成模块,根据所计算的语言风格从预定话术库中选择相应的开场白话术,并使用所计算的人声合成开场白语音。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的用于售货机的智能开场白语音生成方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的用于售货机的智能开场白语音生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇保信安科技有限公司,未经北京奇保信安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011171104.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑施工方法
- 下一篇:一种工业纯铁的冶炼方法





