[发明专利]一种多人文本语音转换装置及方法在审

申请号：	202010949442.6	申请日：	2020-09-10
公开（公告）号：	CN112102809A	公开（公告）日：	2020-12-18
发明（设计）人：	李强;乔文霞;李志	申请（专利权）人：	北方民族大学
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/04;G10L13/08;G10L15/26;G10L17/02
代理公司：	北京方圆嘉禾知识产权代理有限公司 11385	代理人：	程华
地址：	750021 宁夏回族***	国省代码：	宁夏;64
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种人文语音转换装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种多人文本语音转换装置及方法，该装置包括麦克风设备、键鼠及手写板、智能音箱设备和接收设备；所述麦克风设备用于接收用户发出的语音信息；所述键鼠及手写板用于传输用户的文本信息；所述智能音箱设备用于传出经语音合成系统将文本信息转换成的语音信息；所述接收设备用于接收用户传递的语音信息转换成的文本信息。本发明还公开了一种多人文本语音转换方法。本发明在多人协同语音办公场景下，用户根据现有设备及所处环境选择适合的交互设备，不同交互设备用户所述的语音信息、文本信息或者语音和文本两种信息都存在的情况下，通过文本语音后台服务器完成文本语音之间的转换，使得多人之间的交互更加自然友好，从而提高工作效率。

技术领域

本发明属于智能语音交互技术领域，涉及一种多人文本语音转换装置及方法。

背景技术

目前，语音识别技术广泛应用于人机交互领域中，现有的语音识别技术能够准确地和快速地识别语音信号对应的发言对象以及语音信号本身地含义，这极大地推动了人机交互的应用和发展。随着智能设备的普及，目前大多数智能设备(智能手机，智能音箱等)具有自动发音功能，但是目前大部分智能设备只能单纯地发出机器声音，对于需要通过智能设备进行语音交互的用户来说，机器声音比较单调乏味，听起来没有自然语言那样生动形象，且过于生硬，并不能体现出用户本身的特色。除此之外，在协同办公场景下，目前用户对于所述语音信息、文本信息或者文本和语音两种信息都存在的情况下对信息的存储管理不够完善。

综上所述，现有技术存在的问题是：在协同办公场景下，如何实现个性化的语音合成以及完善对信息的存储管理，使得用户之间的交流自然友好，高效完成办公任务。

发明内容

本发明的目的在于克服现有技术中存在的缺陷，提供一种多人文本语音转换装置及方法，该技术方案旨在多人协同语音办公场景下，用户在身份确认之后可以根据现有设备及所处环境选择适合的交互设备，根据不同交互设备用户所述的语音信息、文本信息或者语音和文本两种信息都存在的情况下，可以通过文本-语音后台服务器完成文本-语音之间的转换，使得多人之间的交互更加自然友好，从而提高工作效率。

其技术方案如下：

一种多人文本语音转换装置，包括麦克风设备、键鼠及手写板、智能音箱设备和接收设备；

所述麦克风设备，用于接收用户发出的语音信息；

所述键鼠及手写板，用于传输用户的文本信息；

所述智能音箱设备，用于传出经语音合成系统将文本信息转换成的语音信息；

所述接收设备，用于接收用户传递的语音信息转换成的文本信息。

进一步，所述接收设备包括显示器设备、平板电脑、笔记本电脑、智能手表和其他(智能汽车等)。

进一步，还包括存储管理模块，所述存储管理模块包括文本数据库、语音数据库和个人资料库，所述文本数据库和语音数据库之间通过语音、人物、文本的关系连接在一起；

所述文本数据库，用于存储用户键鼠或触屏方式传输的文本信息或者经过语音识别将语音信息转换成的文本信息；

所述语音数据库，用于存储来自用户麦克风的语音信息。

进一步，还包括麦克风语音信息融合模块，所述麦克风语音信息融合模块包括麦克风信息采集、语音信息增强和语音信息存储格式；

所述麦克风采集信息，调用不同设备的麦克风采集用户语音信息；