[发明专利]基于AI算法实现多模态控制数字人交互方法及装置在审

申请号：	202110207667.9	申请日：	2021-02-25
公开（公告）号：	CN112965593A	公开（公告）日：	2021-06-15
发明（设计）人：	邓江	申请（专利权）人：	浙江百应科技有限公司
主分类号：	G06F3/01	分类号：	G06F3/01;G06F3/16;G10L15/26
代理公司：	杭州浙言专利代理事务所(普通合伙) 33370	代理人：	易朝晖
地址：	311121 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 ai 算法实现多模态控制数字交互方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于AI算法实现多模态控制数字人交互方法，用于用户向终端上的数字人发起语音交互过程中，所述方法包括；获取用户的语音流，其中，所述语音流为所述用户用于咨询业务的输出语音流；将所述语音流通过AI算法识别获得所述语音流对应的用户意图；将所述用户意图信息结构化后发送至业务决策引擎中，所述业务决策引擎基于AI算法与关键字生成话术逻辑匹配获得所述用户意图对应的话术信息，其中，所述话术信息对应有唯一序列号数据；所述终端根据所述唯一序列号数据获取所述话术信息；所述话术信息与所述数字人的数字形象耦合在所述视频输出。

技术领域

本申请涉及人工智能领域，尤其涉及一种基于AI算法实现多模态控制数字人交互方法及装置。

背景技术

数字人，是利用信息科学的方法对人体在不同水平的形态和功能进行虚拟仿真的计算机可视化形态，通过3D图形人物建模、声音克隆技术和动作驱动，结合人工智能技术塑造的数字人已经在多个行业中广泛应用。

然而，目前市面上主流数字人产品均只支持较单一的业务场景，无法根据用户的实时意图与数字人的形象耦合进行交流，且主要用于接待场景的问题咨询，无法完成业务办理。

发明内容

本申请要解决的技术问题，在于提供一种基于AI算法实现多模态控制数字人交互方法及装置，以解决现有数字人产品无法根据用户的实时意图与数字人的形象耦合进行交流的技术问题。

为实现上述目的，本申请采用下述技术方案：

第一方面，本申请提供一种基于AI算法实现多模态控制数字人交互方法，用于用户向终端上的数字人发起语音交互过程中，所述方法包括；

获取用户的语音流，其中，所述语音流为所述用户用于咨询业务的输出语音流；

将所述语音流通过AI算法识别获得所述语音流对应的用户意图；

将所述用户意图信息结构化后发送至业务决策引擎中，所述业务决策引擎基于AI