[发明专利]一种对话角色区分方法、装置、终端设备及存储介质在审

专利信息
申请号: 201810763294.1 申请日: 2018-07-11
公开(公告)号: CN109101486A 公开(公告)日: 2018-12-28
发明(设计)人: 英高海;赵舒阳;李冬梅 申请(专利权)人: 广州杰赛科技股份有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 梁顺宜;郝传鑫
地址: 510310 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 对话 区分性 对话内容 角色 词语 终端设备 词语库 计算机可读存储介质 标签 决策树算法 存储介质 角色识别 判别模型 预先获取 准确率 存储
【说明书】:

发明公开了一种对话角色区分方法、装置、终端设备及计算机可读存储介质,其方法包括:根据待区分对话及区分性词语库,获取所述待区分对话的所有区分性词语;其中,所述区分性词语库用于存储预先获取的区分性词语;所述待区分对话包括至少一句对话内容;根据所述待区分对话的所有区分性词语及预先通过决策树算法建立的对话角色判别模型,获取所述待区分对话中每一句对话内容对应的角色标签;根据所述待区分对话中每一句对话内容对应的角色标签,确定所述待区分对话中每一句对话内容所对应的角色;本发明能够提高对话角色识别的效率及准确率。

技术领域

本发明涉及计算机数据处理领域,尤其涉及一种对话角色区分方法、装置、终端设备及计算机可读存储介质。

背景技术

通常对话内容会涉及两个以上的对话角色,在一些场合需要针对某个对话角色的对白进行分析,以获取对应的信息,例如客服质检,即客服对客户服务的质量检验,它是一个客服中心进行自我问题发现并改进客服质量的基础性工作。在进行分析之前,首先需要将对话角色进行区分,例如客服质量与客服态度的评价等都需要预先区分客服与客户的对话内容,以保证后续自然语言处理的正确性。

传统的对话角色区分方法主要包括以下两种:第一种:通过识别说话者的声纹特征来区分说话者身份,并在语音转化为文本时根据说话者身份将对话内容的文本进行标签;第二种:收集对话内容数据,通过关键字匹配算法确定对话内容对应的对话角色。

在实施本发明的过程中,发明人发现:在上述的第一种对话角色区分方法中,需要对不同人的声纹特征进行采集,花费的精力和成本比较高,而且其易受不同人的身体状况、年龄、情绪等因素的影响以及环境噪音的干扰,此外,在混合说话人的情形下人的声纹特征不易提取,导致对话角色区分方法实现难度大,准确性低;在上述的第二种对话角色区分方法中,通过关键字匹配算法确定对话内容对应的对话角色的方法,由于关键字确定的范围较小或者不准确,容易导致其总体识别准确率较低。

发明内容

针对上述问题,本发明的目的在于提供一种对话角色区分方法、装置、终端设备及计算机可读存储介质,提高对话角色识别的效率及准确率。

第一方面,本发明实施例提供了一种对话角色区分方法,包括以下步骤:

根据待区分对话及区分性词语库,获取所述待区分对话的所有区分性词语;其中,所述区分性词语库用于存储预先获取的区分性词语;所述待区分对话包括至少一句对话内容;

根据所述待区分对话的所有区分性词语及预先通过决策树算法建立的对话角色判别模型,获取所述待区分对话中每一句对话内容对应的角色标签;

根据所述待区分对话中每一句对话内容对应的角色标签,确定所述待区分对话中每一句对话内容所对应的角色。

在第一方面的第一种实现方式中,所述根据待区分对话及区分性词语库,获取所述待区分对话的所有区分性词语,具体为:

响应于接收的角色区别操作,获取待区分对话;

对所述待区别对话中的每一句对话内容进行分词,以获取待区分词语;

将所述待区分词语与所述区分性词语库中的所有区分性词语进行匹配,获取所述待区分对话的所有区分性词语。

根据第一方面的第一种实现方式,在第一方面的第二种实现方式中,所述区分性词语库的建立过程包括以下步骤:

对获取的目标领域的对话语料库中的所有对话内容进行分词,以获取所述对话语料库的所有词语;其中,所述对话语料库包括超过第一预设数量的标准对话内容,和对应于每一句标准对话内容的角色标签;

基于所述对话语料库的所有词语,计算每一句标准对话内容中的各个词语的词频与逆文档频率;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州杰赛科技股份有限公司,未经广州杰赛科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810763294.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top