[发明专利]基于Web的音视频应答系统及其使用方法有效
申请号: | 202110359283.9 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113114860B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 钱晓炯;郑建;蒋莹凯;周波;田晓云 | 申请(专利权)人: | 宁波菊风系统软件有限公司 |
主分类号: | H04M3/493 | 分类号: | H04M3/493;H04L67/02 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 刘凤钦;邓青玲 |
地址: | 315040 浙江省宁波*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 web 视频 应答 系统 及其 使用方法 | ||
1.一种基于Web的音视频应答系统,其特征在于包括音视频通话自动应答服务模块和与音视频通话自动应答服务模块连接的定制业务服务模块,其中音视频通话自动应答服务模块包括核心处理模块、HTML流转换模块和媒体引擎模块;定制业务服务模块则与现有的业务服务系统连接;
所述媒体引擎模块能与SIP网关进行音视频通话对接,同时还能对SIP网关发来的请求指令信号进行解析,得到解析后的请求指令信号,并将解析后得到的请求指令信号发送给核心处理模块;所述媒体引擎模块还能将HTML流转换模块发来的多帧图片编码为视频流,并通过SIP网关发送出去;SIP网关发来的请求指令信号包括DTMF信号或/语音信号;
所述核心处理模块用于接收来自于媒体引擎模块的请求指令信号,并将该请求指令信号发送给定制业务服务模块,并接收定制业务服务模块返回的HTML应答流;核心处理模块在将所述HTML应答流发给HTML流转换模块;
所述HTML流转换模块用于将核心处理模块发来的HTML应答流转换为多帧图片,并发给媒体引擎模块;
所述定制业务服务模块能根据核心处理模块发来的请求指令信号,将该请求指令信号发送给现有的业务服务系统,从而获取对应的媒体资源信息;同时定制业务服务模块将对应的媒体资源信息以HTML页面进行组织构造,生成HTML应答流返回给核心处理模块。
2.根据权利要求1所述的基于Web的音视频应答系统,其特征在于:现有的业务服务系统包括现有的数据库或Web系统或BI数据系统;定制业务服务模块将请求指令信号发送给现有的业务服务系统后,现有的业务服务系统将反馈数据返回给定制业务服务模块,定制业务服务模块再将反馈数据信号、调用的视频流地址及预存的音频信息结合,从而获得对应的所述媒体资源信息。
3.根据权利要求2所述的基于Web的音视频应答系统,其特征在于:定制业务服务模块生成的HTML应答流包括三部分媒体信息:第一部分为HTML正文内容;第二部分为HTML head标签中由meta元素定义的视频流地址、渲染坐标、宽高、层的位置和透明度;第三部分为HTML head标签中meta元素定义的TTS文本及TTS文本的属性。
4.根据权利要求1或2或3所述的基于Web的音视频应答系统,其特征在于:所述HTML流转换模块将接收的HTML应答流中的HTML结构字符串解析为DOM树,HTML流转换模块将HTML应答流中的层叠样式表解析为CSSOM树,HTML流转换模块将HTML应答流中的Javascript脚本,利用DOM API和CSSOM API来操作DOM 树CSSOM树,构建渲染树,最后操作系统的绘图API对渲染树进行绘制,转换为YUV格式的多帧图片。
5.一种如权利要求1所述音视频应答系统的使用方法,其特征在于包括如下步骤:
步骤1、移动用户端通过标准的SIP流程,利用SIP网关与自动应答服务模块建立通话,该通话包括视频通话或语音通话;
步骤2、移动用户端通过SIP网关发送请求指令信号给媒体引擎模块,所述请求指令信号为DTMF信号或语音信号;
步骤3、媒体引擎模块解析请求指令信号,如果请求指令信号为DTMF信号,则解析DTMF信号得到移动用户端按下的键值,如果请求指令信号为语音信号,则识别语音信号中的语音信息,并输出识别文体;
步骤4、媒体引擎模块将解析后键值或识别文本发送给核心处理模块;
步骤5、核心处理模块将解析后键值或识别文本进行封装,发送给定制业务服务模块;
步骤6、定制业务服务模块收到解析后键值或识别文本,将对应的请求指令发送给现有的业务服务系统,现有的业务服务系统将反馈数据返回给定制业务服务模块;
步骤7、定制业务服务模块再将反馈数据信号、调用的视频流地址及预存的音频信息结合,从而获得对应的所述媒体资源信息,再将媒体资源信息以HTML页面进行组织构造,生成HTML应答流返回给核心处理模块,其中,HTML应答流包含三部分媒体信息:第一部分为HTML正文内容;第二部分为HTML head标签中由meta元素定义的视频流地址;第三部分为HTMLhead标签中meta元素定义的TTS文本;
步骤8、核心处理模块在将所述HTML应答流发给HTML流转换模块,由HTML流转换模块将HTML应答流中的第一部分渲染为YUV格式的图片,并发给媒体引擎模块;同时,根据HTML应答流中的第二部分内容中的视频流地址,从视频服务器中拉取视频流给媒体引擎,同时将HTML应答流中第三部分的TTS文本发给TTS处理模块,并将TTS处理模块返回的音频流发送给媒体引擎;
步骤9、媒体引擎模块将YUV格式的图片、从视频服务器( 7) 中拉取的视频流、TTS处理模块返回的音频按HTML中metadate定义的要求进行混合,编码打包为RTP文件,并通过SIP网关返回给移动用户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波菊风系统软件有限公司,未经宁波菊风系统软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110359283.9/1.html,转载请声明来源钻瓜专利网。