[发明专利]基于语义聚类的通话通道构建方法、装置和计算机设备有效
| 申请号: | 202010733115.7 | 申请日: | 2020-07-27 |
| 公开(公告)号: | CN111901554B | 公开(公告)日: | 2022-11-11 |
| 发明(设计)人: | 邹芳;曹磊;李沛恒 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | H04N7/15 | 分类号: | H04N7/15;G10L15/26;G10L15/16;G10L15/06;G10L15/18;G06Q40/04;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
| 地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 语义 通话 通道 构建 方法 装置 计算机 设备 | ||
1.一种基于语义聚类的通话通道构建方法,其特征在于,应用于第一通话终端,包括:
利用所述第一通话终端上预设的第一收音设备,获取输入的第一通话语音数据;其中所述第一通话语音数据是所述第一通话终端的使用者针对预设问题的答复;
获取第二通话终端、第三通话终端、...、第n通话终端分别发送的第二通话语音数据、第三通话语音数据、...、第n通话语音数据;其中所述第二通话语音数据、第三通话语音数据、...、第n通话语音数据指所述第二通话终端、第三通话终端、...、第n通话终端上预设的第二收音设备、第三收音设备、...、第n收音设备分别采集的语音数据;其中所述第二通话语音数据、第三通话语音数据、...、第n通话语音数据分别是所述第二通话终端、第三通话终端、...、第n通话终端的使用者针对所述预设问题的答复;
将所述第一通话语音数据、第二通话语音数据、第三通话语音数据、...、第n通话语音数据,输入预设的语义识别模型中,从而得到所述语义识别模型对应输出的n个语义识别结果;
根据预设的语义聚类方法,对所述n个语义识别结果进行聚类处理,从而得到多个语义组;其中同一个语义组中的语义识别结果相同;
根据预设的识别结果筛选方法,从每个语义组中均选出一个指定语义识别结果,从而得到与所述多个语义组对应的多个指定语义识别结果;
根据预设的语义识别结果与通话终端的对应关系,获取与所述多个指定语义识别结果对应的多个指定通话终端;
构建所述多个指定通话终端之间的视频通话通道;其中每个指定通话终端上均预设有摄像头。
2.根据权利要求1所述的基于语义聚类的通话通道构建方法,其特征在于,所述语义识别模型基于神经网络模型训练而成,所述将所述第一通话语音数据、第二通话语音数据、第三通话语音数据、...、第n通话语音数据,输入预设的语义识别模型中,从而得到所述语义识别模型对应输出的n个语义识别结果的步骤之前,包括:
调取预先收集的m个训练用语音数据;
将所述m个训练用语音数据输入已训练完成的语音识别模型中,从而得到所述语音识别模型输出的m个语音识别文本;其中所述m个语音识别文本由第一语音识别文本、第二语音识别文本、...、第m语音识别文本构成;
根据预设的相似算法,计算所述m个语音识别文本与预设的多个参照语义之间的相似度值;
构建与所述m个语音识别文本对应的m个样本组,其中第一个样本组由第一语音识别文本和与所述第一语音识别文本最相似的参照语义构成,第二个样本组由第二语音识别文本和与所述第二语音识别文本最相似的参照语义构成,...,第m个样本组由第m语音识别文本和与所述第m语音识别文本最相似的参照语义构成;
将所述m个样本组按预设比例划分为训练组和验证组;
将所述训练组输入预设的神经网络模型中进行训练,从而得到中间模型;
利用所述验证组对所述中间模型进行验证,以得到验证结果,并判断所述验证结果是否为验证通过;
若所述验证结果为验证通过,则将所述中间模型记为所述语义识别模型。
3.根据权利要求1所述的基于语义聚类的通话通道构建方法,其特征在于,所述根据预设的语义聚类方法,对所述n个语义识别结果进行聚类处理,从而得到多个语义组的步骤,包括:
根据预设的向量映射方法,将所述n个语义识别结果分别映射为高维空间的n个高维向量;
根据公式:
计算出一个高维向量A与一个高维向量B的相似程度值Q,从而得到与所述n个高维向量对应的多个相似程度值;其中,A、B均为所述n个高维向量中的任意一个高维向量,Ai为高维向量A的第i个分向量,Bi为高维向量B的第i个分向量,高维向量A与高维向量B 均为t维向量;
构建多个语义组,其中每个语义组均至少包括两个语义识别结果,并且同一个语义组中的语义识别结果两两之间的相似程度值Q小于预设的相似阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010733115.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种石灰石供浆系统故障应急处理系统
- 下一篇:带有压缩功能的回收箱





