[发明专利]AI智能语音流采集在审
申请号: | 201911209849.9 | 申请日: | 2019-12-02 |
公开(公告)号: | CN112908316A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 谢伟平;柯玉蒙 | 申请(专利权)人: | 浙江思考者科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;G10L15/30;G10L15/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 311115 浙江省杭州市余杭区仓前街*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ai 智能 语音 采集 | ||
1.AI智能语音流采集,其特征在于,包括以下具体使用方法:
步骤一:部署配置:
首先在win7系统环境下下载最新的python版本,然后安装下载包python-3.6.4-amd64.exe(安装版)搭配JDK1.8、Eclipse4.6版本,然后为装置添加安装目录搭到环境变量,只需要把python的安装目录添加到pth系统变量中即可;
步骤二:部署测试:
测试python安装是否成功,cmd打开命令行输入 python 命令,输入 print ('HelloWorld'),经过以上测试,python环境安装完毕;
步骤三:与云服务器连接:
AI语音云服务器所需要的技术模块有四个部分,分别为自动语音识别、自然语言理解、自然语言生成和文字转语音;
步骤四:程序开启测试:
启动程序,在注意此刻采集到的语音流是否发送,在对麦克风说一句话,再看语音流是否发送;
步骤五::程序正式开启:
测试完成后,采集到的语音流可以成功发送,对麦克风说话,语音流可以进行发送,则正式开启程序将有效语音流发送云服务器进行自动语音识别、自然语言理解、自然语言生成和文字转语音;
步骤六:语音流的采集:
程序启动后实时监听麦克风的语音流,用户在麦克风讲话,系统通过取样频率进行语音流采集;
步骤七:人声分析及上传云服务器:
将采集到的语音流转化为数组,然后判断这句话的音量大小是否高于预设值,如果高于预设值则将语音流传递到云服务器,进行后续的语音识别机逻辑处理。
2.根据权利要求1所述的AI智能语音流采集,其特征在于:步骤三中四个模块组交互流程的核心为意图。
3.根据权利要求2所述的AI智能语音流采集,其特征在于:意图主要表示为用户在使用AI语音流采集后所说的语音,这些意图代表了AI智能的核心功能,如果AI智能成功地识别了用户的意图,则需要AI语音流采集到用户语音后,将结果反馈给用户,如果AI智能无法识别用户意图,则需要给用户进行提示,指导用户使用。
4.根据权利要求3所述的AI智能语音流采集,其特征在于:AI智能如何识别去意图,主要是对AI语音流采集到用户语音进行语义解析,即对语音识别结果进行分析理解,简单来说就是将用户的语音对对应到每一个的机器指令,然后对机器指令进行分析,向云服务器请求处理后做出反馈响应,解决用户问题的答案,根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言的句子,同时将自然语言生成模块生成的句子转换成语音输出。
5.根据权利要求1所述的AI智能语音流采集,其特征在于:步骤四中如果采集到的语音流成功发送,对麦克风说一句话,语音流无法发送,则更换麦克风进行测试,若采集到的语音流无法发送,则对程序运行环境及自动语音识别模组进行调试,直至采集到的语音流可以成功发送,对麦克风说话,语音流可以进行发送。
6.根据权利要求1所述的AI智能语音流采集,其特征在于:步骤七中人声分析是对采集到的语音进行分析,当这个语音流的最大音量阈值大于预设量,则进行采集,判别过后对语音流进行发送,若语音流的最大音量阈值小于预设量则进行杂音消除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江思考者科技有限公司,未经浙江思考者科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911209849.9/1.html,转载请声明来源钻瓜专利网。