[发明专利]一种基于生成式多轮对话意图识别的骚扰电话屏蔽方法有效
申请号: | 202110312923.0 | 申请日: | 2021-03-24 |
公开(公告)号: | CN112800206B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 朱海峰;颜小君;陈正鹏 | 申请(专利权)人: | 南京万得资讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/279;G06F40/35 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐俊 |
地址: | 210019 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 轮对 意图 识别 骚扰 电话 屏蔽 方法 | ||
本发明提供了一种基于生成式多轮对话意图识别的骚扰电话屏蔽方法,采用GPT‑dialog模型实现与主叫方自动进行多轮语音对话。并基于少量有标记语音对话语料,采用BERT‑RCNN模型与LDA主题模型,实现多轮对话骚扰意图的实时评分。当实时骚扰意图评分高于置信度则将来电判别为骚扰电话进行屏蔽。本发明采用基于Transformer预训练模型的生成式算法实现了自动的多轮语音对话,成倍降低了构建庞大的问答语料库的人力成本,提高交互体验的同时也提升了意图判别的准确性;本发明采用深度分类算法和主题分类算法构建了实时意图判别的模型,能够不断学习和校正对前面的对话内容的识别结果,使意图识别结果更加健壮。
技术领域
本发明涉及一种基于生成式多轮对话意图识别的骚扰电话屏蔽方法,涉及自然语言处理技术领域。
背景技术
如今人类正处于一个科技爆发和信息爆炸的年代,在感受科技带来便利的同时,各种各样的信息骚扰也纷至沓来,而电话骚扰情况尤其严峻,因此设计有效的骚扰电话屏蔽方法非常具有价值。然而目前主流的骚扰电话屏蔽方法并没有有效的进行陌生号码的屏蔽,或者容易错误屏蔽一些重要的来电,无法满足用户的实际需求。当前主要的骚扰电话屏蔽方法有如下几种:
第一种采用来电标记的方式。即通过收集被叫方对当前来电的类型标记为当前电话号码打上标签,如果当前号码被多次标记成骚扰(诈骗、推销等等),则该电话号码的后续来电将均被屏蔽。这种方式适合屏蔽具有多次骚扰行为的来电。
第二种采用呼叫转接的方式。即为陌生来电设置一系列的提示音操作,只有完成提示要求的操作才能被接入。这种方式因主叫方操作复杂并且耗时较长,主要用于客服系统。
第三种采用基于问答系统构建的智能语音对话方式。即采用NLP技术加人工整理的方式收集大量用户对话语料,构建庞大的问答系统,并通过问答系统自动与主叫方进行对话,对话过程中如果系统意图识别为非骚扰则将呼叫向被叫方转接。该方式通过主动的对话引导主叫方表达意图,从而进行骚扰识别,可适用于多种场景。
对比以上三种方式,第一种方式的缺点是对于新号码缺少相关标记记录,无法立即解决新号码产生的电话骚扰行为。第二种方式的缺点是主叫方的操作过于耗时,无法适用于普通的用户场景,对于陌生紧急电话场景显然很难适用。第三种方式通过构建问答系统来实现智能语音对话以判别用户的真实意图,需要投入大量的人力进行问答对语料的构建,且在应用于多场景时容易因语料不足导致无法连续进行多轮对话以获取真实意图。但是该方法具有较好的泛化性,且用户体验更好。
发明内容
本发明的目的是:提供一种有效的骚扰电话屏蔽方法。
为了达到上述目的,本发明的技术方案是提供了一种基于生成式多轮对话意图识别的骚扰电话屏蔽方法,其特征在于,包括以下步骤:
步骤1、收集语音对话通用语料,采集语音对话中前5轮对话的文本作为多轮对话模型的训练语料;
同时,人工按照不同骚扰电话的类别分别提取部分骚扰电话对话语料作为意图识别的骚扰电话对话训练样本,并依据骚扰电话的类别,对每个骚扰电话对话训练样本进行人工标注;
步骤2、基于步骤1获得的所有训练语料构建GPT-dialog生成式问答模型,用于进行自动多轮对话交互,具体包括以下步骤:
步骤201、选取采用相对位置编码构建的Transformer预训练模型,并且针对Transformer预训练模型的Attention矩阵加入下三角形式的Mask,生成单向语言模型GPT;
步骤202、在步骤201得到的单向语言模型GPT的基础上选用分类算法通用的交叉熵损失函数来计算单向语言模型GPT在迭代优化过程中的损失,并采用AdamW优化器来更新单向语言模型GPT训练的参数值;最后使用随机采样算法来进行文本的解码输出,由此,完成了GPT-dialog生成式问答模型的搭建;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京万得资讯科技有限公司,未经南京万得资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110312923.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源商用车转向系统
- 下一篇:植物空心胶囊的制备方法