[发明专利]一种识别人机对话中坏例的方法及装置在审
申请号: | 201911325819.4 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111177347A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 郭灿 | 申请(专利权)人: | 上海优扬新媒信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
地址: | 201800 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 人机对话 中坏例 方法 装置 | ||
本发明公开了一种识别人机对话中坏例的方法及装置,从获取的待识别人机对话数据中提取对话特征信息,并基于对话特征信息以及预先建立的badcase筛选规则,来获得待识别人机对话数据是否是badcase的识别结果。因此,当识别结果为待识别人机对话数据为badcase时,就可以基于badcase的具体问题进行针对性的优化,从而保证人机交互的顺利进行,更好的满足用户的需求。
技术领域
本发明涉及计算机技术领域,更具体的说,涉及一种识别人机对话中坏例的方法及装置。
背景技术
人机交互是指人与机器之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与机器之间的信息交换过程。
在人机交互过程中,单条对话的逻辑是:以用户所说的话为样本,机器根据一系列的规则将样本识别到意图上,根据意图确定对应的话术,并播放对应的话术。然而在实际应用中,机器可能因为缺少用户的说话样本,而无法识别用户所说的话或者对用户提出的问题回答错误。机器存在的无法识别用户所说的话或者对用户提出的问题回答错误的情况,称为人机对话中的坏例(badcase)。坏例的存在会导致人机交互无法顺利进行,因此影响了人机交互功能的可靠性。
因此,需要识别人机对话中的badcase,以作为对人机交互进行优化的依据或基础,才能更好的满足用户的需求。
发明内容
有鉴于此,本发明公开一种识别人机对话中坏例的方法及装置,以实现对人机对话数据是否是badcase进行识别,以便基于badcase的具体问题进行针对性的优化,从而保证人机交互的顺利进行,更好的满足用户的需求。
一种识别人机对话中坏例的方法,所述方法包括:
获取待识别人机对话数据;
从所述待识别人机对话数据中,提取出对话特征信息;
基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,其中,所述badcase筛选规则基于历史标注badcase通话样本集确定。
可选的,所述对话特征信息包括:用于表征对话数据量的特征和/或用于表征对话内容的特征;
所述用于表征对话数据量的特征包括:对话总时长、单条对话时长和单条对话字数中的任意一个或多个的组合;
所述用于表征对话内容的特征包括:关键词。
可选的,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
获取预先依据用于表征对话内容特征建立的所述badcase筛选规则,所述badcase筛选规则包括:关键词及该关键词至少出现的次数,所述关键词为所述从历史标注badcase通话样本集中出现的统计值超过预设统计值的词;
判断所述对话特征信息中包含的关键词及所述关键词出现的次数,是否符合所述预先建立的至少一条badcase筛选规则中的至少一条规则;
如果是,则确定所述待识别人机对话数据为badcase;
如果否,则确定所述待识别人机对话数据不为badcase。
可选的,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
获取预先依据用于表征对话数据量的特征建立的所述badcase筛选规则,所述badcase筛选规则包括:对话总时长、单条对话时长和单条对话字数中的任意一个或多个的组合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海优扬新媒信息技术有限公司,未经上海优扬新媒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911325819.4/2.html,转载请声明来源钻瓜专利网。