[发明专利]AI智能语音流采集在审

申请号：	201911209849.9	申请日：	2019-12-02
公开（公告）号：	CN112908316A	公开（公告）日：	2021-06-04
发明（设计）人：	谢伟平;柯玉蒙	申请（专利权）人：	浙江思考者科技有限公司
主分类号：	G10L15/18	分类号：	G10L15/18;G10L15/22;G10L15/30;G10L15/34
代理公司：	暂无信息	代理人：	暂无信息
地址：	311115 浙江省杭州市余杭区仓前街***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	ai 智能语音采集
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.AI智能语音流采集，其特征在于，包括以下具体使用方法：

步骤一：部署配置：

首先在win7系统环境下下载最新的python版本，然后安装下载包python-3.6.4-amd64.exe（安装版）搭配JDK1.8、Eclipse4.6版本，然后为装置添加安装目录搭到环境变量，只需要把python的安装目录添加到pth系统变量中即可；

步骤二：部署测试：

测试python安装是否成功，cmd打开命令行输入 python 命令，输入 print ('HelloWorld')，经过以上测试，python环境安装完毕；

步骤三：与云服务器连接：

AI语音云服务器所需要的技术模块有四个部分，分别为自动语音识别、自然语言理解、自然语言生成和文字转语音；

步骤四：程序开启测试：

启动程序，在注意此刻采集到的语音流是否发送，在对麦克风说一句话，再看语音流是否发送；

步骤五：：程序正式开启：

测试完成后，采集到的语音流可以成功发送，对麦克风说话，语音流可以进行发送，则正式开启程序将有效语音流发送云服务器进行自动语音识别、自然语言理解、自然语言生成和文字转语音；

步骤六：语音流的采集：

程序启动后实时监听麦克风的语音流，用户在麦克风讲话，系统通过取样频率进行语音流采集；

步骤七：人声分析及上传云服务器：

将采集到的语音流转化为数组，然后判断这句话的音量大小是否高于预设值，如果高于预设值则将语音流传递到云服务器，进行后续的语音识别机逻辑处理。

2.根据权利要求1所述的AI智能语音流采集，其特征在于：步骤三中四个模块组交互流程的核心为意图。

3.根据权利要求2所述的AI智能语音流采集，其特征在于：意图主要表示为用户在使用AI语音流采集后所说的语音，这些意图代表了AI智能的核心功能，如果AI智能成功地识别了用户的意图，则需要AI语音流采集到用户语音后，将结果反馈给用户，如果AI智能无法识别用户意图，则需要给用户进行提示，指导用户使用。

4.根据权利要求3所述的AI智能语音流采集，其特征在于：AI智能如何识别去意图，主要是对AI语音流采集到用户语音进行语义解析，即对语音识别结果进行分析理解，简单来说就是将用户的语音对对应到每一个的机器指令，然后对机器指令进行分析，向云服务器请求处理后做出反馈响应，解决用户问题的答案，根据解析模块得到的内部表示，在对话管理机制的作用下生成自然语言的句子，同时将自然语言生成模块生成的句子转换成语音输出。

5.根据权利要求1所述的AI智能语音流采集，其特征在于：步骤四中如果采集到的语音流成功发送，对麦克风说一句话，语音流无法发送，则更换麦克风进行测试，若采集到的语音流无法发送，则对程序运行环境及自动语音识别模组进行调试，直至采集到的语音流可以成功发送，对麦克风说话，语音流可以进行发送。

6.根据权利要求1所述的AI智能语音流采集，其特征在于：步骤七中人声分析是对采集到的语音进行分析，当这个语音流的最大音量阈值大于预设量，则进行采集，判别过后对语音流进行发送，若语音流的最大音量阈值小于预设量则进行杂音消除。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江思考者科技有限公司，未经浙江思考者科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911209849.9/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]AI智能语音流采集在审

专利文献下载