[发明专利]文本质检的方法、存储介质及电子设备有效

专利信息
申请号: 201911118009.1 申请日: 2019-11-15
公开(公告)号: CN110909162B 公开(公告)日: 2020-10-27
发明(设计)人: 聂镭;李睿;聂颖 申请(专利权)人: 龙马智芯(珠海横琴)科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06F40/289
代理公司: 暂无信息 代理人: 暂无信息
地址: 519000 广东省珠海市横琴新区环岛*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 质检 方法 存储 介质 电子设备
【说明书】:

发明提出的质检模型训练方法,通过该训练方法,可以得到训练好的质检模型,该质检模型无需要人为设定质检表达式,只要将话术脚本及待质检文本输入到模型中,即可得到质检是否通过的结果,使得质检过程更加简单高效,使得使用该质检模型的质检系统更加智能。本发明提出的文本质检的方法,可以实现全自动的文本质检,无需人为的参与,实现了话术脚本的质检标准词的自动提取,同时利用质检标准词两两组合得到的质检词对的相对距离值作为质检的标准,因此不需要制定复杂的质检表达式,使得质检的方式更为智能、简单高效。

技术领域

本发明涉及自然语言处理领域,特别是一种文本质检的方法、存储介质及电子设备。

背景技术

电话销售流程中,为了保障销售的合规性,需要坐席按照法律法规和公司的规章制度进行推销。如保险等合规性要求高的行业,甚至需要坐席人员严格的按照标准的话术脚本进行推销。为了保证坐席人员的工作质量,需要质检人员对坐席的通话录音进行质量检测。传统的质检方式是质检人员,根据话术脚本的质检要点,通过人工听录音的方式进行质检。这种质检方式不但效率低,而且只能通过抽检的方式进行,其中大量的电话录音不能被质检。

现有技术中,为了解决上述人工进行质检的将效率低的问题,出现了各种利用语音识别、自然语义分析等技术的智能质检系统,可以实现对语音全量质检,同时在很大程度上提高质检效率。然而,在使用这些质检系统,质检人员需要先人为设定质检表达式,这就需要质检人员能够充分的了解并灵活运用这些质检规则,否则,质检表达式一旦设定错误,则会导致质检结果的错误。例如,在某公司的质检系统中,其质检规则非常复杂,使得使用该系统的质检人员很容易出错。其质检表达式由规则、条件、检查范围和算子组合组成,并需要通过各种复杂的组合形成的质检表达式,因此,质检人员上岗使用该系统时,需要提前进行系统的培训,这增加了质检人员的培训成本。同时,由于系统复杂的操作,质检人员难免会出现操作错误的时候,从而导致质检结果的不准确。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。有鉴于此,本发明提供了一种质检模型的训练方法,该方法包括:

获取带标记的话术脚本,从所述带标记的话术脚本中提取质检标准词,所述质检标准词包括若干质检词;

获取质检模型的训练数据,所述训练数据包括正样本和负样本,所述正样本为质检结果为通过的文本数据,所述负样本为质检结果为不通过的文本数据;

根据所述质检标准词,对所述训练数据的文本数据进行向量化处理,得到所述文本数据的向量;

根据所述文本数据的向量,对所述质检模型进行训练,得到训练完成后的所述质检模型。

进一步地,所述带标记的话术脚本的标记包括:高亮处理的文字和/或者标记有底纹的文字。

进一步地,从所述带标记的话术脚本中提取质检标准词包括:

从所述带标记的话术脚本中提取标记对应的标记文字,对所述标记文字进行分词处理,得到分词结果;使用IDF的方法对所述分词结果的进行数值变换,得到所述分词结果的IDF值;根据所述IDF值得到所述质检标准词。

进一步地,根据所述质检标准词,对所述训练数据的文本数据进行向量化处理,得到所述文本数据的向量,包括:

定位并标记全部所述质检标准词在所述文本数据中的绝对位置,若所述文本数据中不存在对应的某个所述质检标准词,则将所述质检标准词在文本数据中的绝对位置标记为一个特定值;将所述质检标准词进行两两组合得到质检词对,计算所述质检词对的相对距离;将所述相对距离的值作为所述文本数据的向量元素;根据所述向量元素,得到所述文本数据的向量。

进一步地,根据所述文本数据的向量,对所述质检模型进行训练,得到训练完成后的所述质检模型,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911118009.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top