[发明专利]语音交互三元组自动生成方法、装置、终端及介质在审
申请号: | 202211000873.3 | 申请日: | 2022-08-19 |
公开(公告)号: | CN115374796A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 徐超君;郑达;张雨晨;任清卉 | 申请(专利权)人: | 上海湃舵智能科技有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/263;G10L15/26;G10L15/16 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 倪静 |
地址: | 200241 上海市闵行区紫*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 三元 自动 生成 方法 装置 终端 介质 | ||
本申请提供语音交互三元组自动生成方法、装置、终端及介质,对客服问答音频进行语音识别以转换成对应的文本数据,并对文本数据进行声道分辨及轮次打标;将文本数据按照声道顺序展开,并从客服问答中截取涵盖有全部参与者的声道交互作为一个序列组,并为各序列组赋予唯一的序列标识以形成对应的三元组;对全部三元组中的各个元素的文本句式内容进行相似句式聚类,并为每种聚类结果赋予唯一的元素聚类标识;根据每个三元组中各个元素所属的元素聚类标识生成该三元组的三元组聚类标识;分别计算各三元组的三元组聚类标识以及组内各元素的元素聚类标识的频次,选取高频计算结果以用于构建客服交互模型,实现三元组自动化生成,高效且提升数据利用率。
技术领域
本申请涉及语音处理技术领域,特别是涉及语音交互三元组自动生成方法、装置、终端及介质。
背景技术
当前,通常使用如下2种方式产生三元组:
方式1)通过人工录音分析:首先,批量将人工客服语音音频导入AI模型中,通过语音识别技术(ASR)将语音转成文本,并为文本分声道和轮次打上标签。其次,人工通过对交互文本的分析提炼得到子流程的交互流程和话术。最后,通过对用户话术进行提炼总结出AI模型的语义理解(NLU)本体论,安排标注扩写,得到AI模型数据集。
方式2)通过用户需求人工主观设计:根据用户的需求和设计人员的实际经验去设计交互和话术,并准备AI模型数据集。
然而,以上的技术方案会存在以下几个问题:
问题1)无法实现全自动化生成三元组导致效率低下:由于现有流程中,从文本到三元组的流程有过多的人为参与,从交互流程和话术设计到AI模型的建立,整体人的周期需要5个工作日左右,所以效率较低。
问题2)三元组设计欠缺合理性:尽管会有部分数据支持,但合理性主要基于人工的经验判断,人的主观经验设计基本上都会存在一定缺陷性,所以三元组的适配性和实际效果,可能远远达不到预期,即合理性并没有得到充分验证。
问题3)数据利用率低:由于现有的数据未被自动化分析,大部分是人的主观分析,所以随着数据量级的增加会增加分析难度,也即是说,数据的量级在现有流程中并未对三元组起到明显的促进作用,数据的利用率很低。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供语音交互三元组自动生成方法、装置、终端及介质,用于解决音频领域的三元组生成方法自动化程度低、设计欠缺合理性及数据利用率低的技术问题。
为实现上述目的及其他相关目的,本申请的第一方面提供一种语音交互三元组自动生成方法,包括:对客服问答音频进行语音识别以转换成对应的文本数据,并对所述文本数据进行声道分辨及轮次打标;将所述文本数据按照声道顺序展开,并从客服问答中截取涵盖有全部参与者的声道交互作为一个序列组,并为各所述序列组赋予唯一的序列标识以形成对应的三元组;对全部三元组中的各个元素的文本句式内容进行相似句式聚类,并为每种聚类结果赋予唯一的元素聚类标识;根据每个三元组中各个元素所属的元素聚类标识生成该三元组的三元组聚类标识;分别计算各三元组的三元组聚类标识以及组内各元素的元素聚类标识的频次,并选取其中的高频计算结果以用于构建客服交互模型。
于本申请的第一方面的一些实施例中,所述客服问答音频的参与者包括客服和用户;所述三元组的格式包括(客服1,用户,客服2);在所形成的相邻三元组中,前一三元组的末元素与后一三元组的首元素相同。
于本申请的第一方面的一些实施例中,在对三元组内各元素的元素聚类标识进行频次计算前执行如下:按照各元素聚类标识下的元素按照情绪识别结果进行再分类;按照子类数量将原有的元素聚类标识拆分为相应数量的元素聚类子标识;根据各个元素聚类标识或元素聚类子标识进行频次计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海湃舵智能科技有限公司,未经上海湃舵智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211000873.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:机车限界检查装置
- 下一篇:基于云边协同的日志采集方法、装置、设备及介质