[发明专利]一种对话角色区分方法、装置、终端设备及存储介质在审

专利信息
申请号: 201810763294.1 申请日: 2018-07-11
公开(公告)号: CN109101486A 公开(公告)日: 2018-12-28
发明(设计)人: 英高海;赵舒阳;李冬梅 申请(专利权)人: 广州杰赛科技股份有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 梁顺宜;郝传鑫
地址: 510310 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 对话 区分性 对话内容 角色 词语 终端设备 词语库 计算机可读存储介质 标签 决策树算法 存储介质 角色识别 判别模型 预先获取 准确率 存储
【权利要求书】:

1.一种对话角色区分方法,其特征在于,包括以下步骤:

根据待区分对话及区分性词语库,获取所述待区分对话的所有区分性词语;其中,所述区分性词语库用于存储预先获取的区分性词语;所述待区分对话包括至少一句对话内容;

根据所述待区分对话的所有区分性词语及预先通过决策树算法建立的对话角色判别模型,获取所述待区分对话中每一句对话内容对应的角色标签;

根据所述待区分对话中每一句对话内容对应的角色标签,确定所述待区分对话中每一句对话内容所对应的角色。

2.根据权利要求1所述的对话角色区分方法,其特征在于,所述根据待区分对话及区分性词语库,获取所述待区分对话的所有区分性词语,具体为:

响应于接收的角色区别操作,获取待区分对话;

对所述待区别对话中的每一句对话内容进行分词,以获取待区分词语;

将所述待区分词语与所述区分性词语库中的所有区分性词语进行匹配,获取所述待区分对话的所有区分性词语。

3.根据权利要求2所述的对话角色区分方法,其特征在于,所述区分性词语库的建立过程包括以下步骤:

对获取的目标领域的对话语料库中的所有对话内容进行分词,以获取所述对话语料库的所有词语;其中,所述对话语料库包括超过第一预设数量的标准对话内容,和对应于每一句标准对话内容的角色标签;

基于所述对话语料库的所有词语,计算每一句标准对话内容中的各个词语的词频与逆文档频率;

根据所述每一句标准对话内容中的各个词语的词频与逆文档频率,获取所述每一句标准对话内容的原始特征向量;

根据每一句标准对话内容对应的角色标签及对应的原始特征向量,计算每一句标准对话内容中的各个词语的信息增益比;

根据所述每一句标准对话内容中的各个词语的信息增益比,获取第二预设数量的词语作为区分性词语,以建立所述区分性词语库;其中,从所述对话语料库的所有词语中获取的所述区分性词语的信息增益比大于剩余词语的信息增益比。

4.根据权利要求3所述的对话角色区分方法,其特征在于,所述对话角色判别模型的训练过程包括以下步骤:

根据所述对话语料库中的每一句标准对话内容的原始特征向量及所述区分性词语库,获取所述每一句标准对话内容的区分特征向量;

根据所有标准对话内容的区分特征向量及对应于每一句标准对话内容的角色标签,通过决策树算法进行对话角色判别模型训练,以获取包括区分特征向量与角色标签对应关系的对话角色判别模型。

5.根据权利要求4所述的对话角色区分方法,其特征在于,所述根据所述待区分对话的所有区分性词语及预先通过决策树决策树算法建立的对话角色判别模型,获取所述待区分对话中每一句对话内容对应的角色标签,具体为:

基于所述对话语料库的所有词语,计算所述待区分对话的每一句对话内容中的所有区分性词语的词频与逆文档频率;

基于所述区分性词语库,通过所述每一句对话内容的所有区分性词语的词频与逆文档频率,计算所述待区分对话中的每一句对话内容的区分特征向量;

将所述待区分对话中的每一句对话内容的区分特征向量输入所述对话角色判别模型中进行分析,以获取所述待区分对话中的每一句对话内容对应的角色标签。

6.根据权利要求5所述的对话角色区分方法,其特征在于,所述基于所述对话语料库的所有词语,计算所述待区分对话的每一句对话内容中的所有区分性词语的词频与逆文档频率,具体为:

根据所述对话语料库中的所有词语,计算所述待区分对话的每一句对话内容中的所有区分性词语的词频;

对于所述待区分对话的每一句对话内容中的各个区分性词语,分别获取所述对话语料库中具有对应的区分性词语的标准对话内容的数量;

对于所述待区分对话的每一句对话内容中的各个区分性词语,分别根据所述对话语料库中的标准对话内容的总数及所述对话语料库中具有对应的区分性词语的标准对话内容的数量,获取所述待区分对话的每一句对话内容中的各个区分性词语的逆文档频率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州杰赛科技股份有限公司,未经广州杰赛科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810763294.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top