[发明专利]一种对话角色区分方法、装置、终端设备及存储介质在审
| 申请号: | 201810763294.1 | 申请日: | 2018-07-11 |
| 公开(公告)号: | CN109101486A | 公开(公告)日: | 2018-12-28 |
| 发明(设计)人: | 英高海;赵舒阳;李冬梅 | 申请(专利权)人: | 广州杰赛科技股份有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 梁顺宜;郝传鑫 |
| 地址: | 510310 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对话 区分性 对话内容 角色 词语 终端设备 词语库 计算机可读存储介质 标签 决策树算法 存储介质 角色识别 判别模型 预先获取 准确率 存储 | ||
1.一种对话角色区分方法,其特征在于,包括以下步骤:
根据待区分对话及区分性词语库,获取所述待区分对话的所有区分性词语;其中,所述区分性词语库用于存储预先获取的区分性词语;所述待区分对话包括至少一句对话内容;
根据所述待区分对话的所有区分性词语及预先通过决策树算法建立的对话角色判别模型,获取所述待区分对话中每一句对话内容对应的角色标签;
根据所述待区分对话中每一句对话内容对应的角色标签,确定所述待区分对话中每一句对话内容所对应的角色。
2.根据权利要求1所述的对话角色区分方法,其特征在于,所述根据待区分对话及区分性词语库,获取所述待区分对话的所有区分性词语,具体为:
响应于接收的角色区别操作,获取待区分对话;
对所述待区别对话中的每一句对话内容进行分词,以获取待区分词语;
将所述待区分词语与所述区分性词语库中的所有区分性词语进行匹配,获取所述待区分对话的所有区分性词语。
3.根据权利要求2所述的对话角色区分方法,其特征在于,所述区分性词语库的建立过程包括以下步骤:
对获取的目标领域的对话语料库中的所有对话内容进行分词,以获取所述对话语料库的所有词语;其中,所述对话语料库包括超过第一预设数量的标准对话内容,和对应于每一句标准对话内容的角色标签;
基于所述对话语料库的所有词语,计算每一句标准对话内容中的各个词语的词频与逆文档频率;
根据所述每一句标准对话内容中的各个词语的词频与逆文档频率,获取所述每一句标准对话内容的原始特征向量;
根据每一句标准对话内容对应的角色标签及对应的原始特征向量,计算每一句标准对话内容中的各个词语的信息增益比;
根据所述每一句标准对话内容中的各个词语的信息增益比,获取第二预设数量的词语作为区分性词语,以建立所述区分性词语库;其中,从所述对话语料库的所有词语中获取的所述区分性词语的信息增益比大于剩余词语的信息增益比。
4.根据权利要求3所述的对话角色区分方法,其特征在于,所述对话角色判别模型的训练过程包括以下步骤:
根据所述对话语料库中的每一句标准对话内容的原始特征向量及所述区分性词语库,获取所述每一句标准对话内容的区分特征向量;
根据所有标准对话内容的区分特征向量及对应于每一句标准对话内容的角色标签,通过决策树算法进行对话角色判别模型训练,以获取包括区分特征向量与角色标签对应关系的对话角色判别模型。
5.根据权利要求4所述的对话角色区分方法,其特征在于,所述根据所述待区分对话的所有区分性词语及预先通过决策树决策树算法建立的对话角色判别模型,获取所述待区分对话中每一句对话内容对应的角色标签,具体为:
基于所述对话语料库的所有词语,计算所述待区分对话的每一句对话内容中的所有区分性词语的词频与逆文档频率;
基于所述区分性词语库,通过所述每一句对话内容的所有区分性词语的词频与逆文档频率,计算所述待区分对话中的每一句对话内容的区分特征向量;
将所述待区分对话中的每一句对话内容的区分特征向量输入所述对话角色判别模型中进行分析,以获取所述待区分对话中的每一句对话内容对应的角色标签。
6.根据权利要求5所述的对话角色区分方法,其特征在于,所述基于所述对话语料库的所有词语,计算所述待区分对话的每一句对话内容中的所有区分性词语的词频与逆文档频率,具体为:
根据所述对话语料库中的所有词语,计算所述待区分对话的每一句对话内容中的所有区分性词语的词频;
对于所述待区分对话的每一句对话内容中的各个区分性词语,分别获取所述对话语料库中具有对应的区分性词语的标准对话内容的数量;
对于所述待区分对话的每一句对话内容中的各个区分性词语,分别根据所述对话语料库中的标准对话内容的总数及所述对话语料库中具有对应的区分性词语的标准对话内容的数量,获取所述待区分对话的每一句对话内容中的各个区分性词语的逆文档频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州杰赛科技股份有限公司,未经广州杰赛科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810763294.1/1.html,转载请声明来源钻瓜专利网。





