[发明专利]一种识别人机对话中坏例的方法及装置在审
| 申请号: | 201911325819.4 | 申请日: | 2019-12-20 |
| 公开(公告)号: | CN111177347A | 公开(公告)日: | 2020-05-19 |
| 发明(设计)人: | 郭灿 | 申请(专利权)人: | 上海优扬新媒信息技术有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
| 地址: | 201800 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 识别 人机对话 中坏例 方法 装置 | ||
1.一种识别人机对话中坏例的方法,其特征在于,所述方法包括:
获取待识别人机对话数据;
从所述待识别人机对话数据中,提取出对话特征信息;
基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,其中,所述badcase筛选规则基于历史标注badcase通话样本集确定。
2.根据权利要求1所述的方法,其特征在于,所述对话特征信息包括:用于表征对话数据量的特征和/或用于表征对话内容的特征;
所述用于表征对话数据量的特征包括:对话总时长、单条对话时长和单条对话字数中的任意一个或多个的组合;
所述用于表征对话内容的特征包括:关键词。
3.根据权利要求2所述的方法,其特征在于,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
获取预先依据用于表征对话内容特征建立的所述badcase筛选规则,所述badcase筛选规则包括:关键词及该关键词至少出现的次数,所述关键词为所述从历史标注badcase通话样本集中出现的统计值超过预设统计值的词;
判断所述对话特征信息中包含的关键词及所述关键词出现的次数,是否符合所述预先建立的至少一条badcase筛选规则中的至少一条规则;
如果是,则确定所述待识别人机对话数据为badcase;
如果否,则确定所述待识别人机对话数据不为badcase。
4.根据权利要求2所述的方法,其特征在于,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
获取预先依据用于表征对话数据量的特征建立的所述badcase筛选规则,所述badcase筛选规则包括:对话总时长、单条对话时长和单条对话字数中的任意一个或多个的组合;
判断所述对话特征信息的用于表征对话数据量的特征,是否符合所述对话总时长、所述单条对话时长和所述单条对话字数中的任意一个或多个的组合;
如果是,则确定所述待识别人机对话数据为badcase;
如果否,则确定所述待识别人机对话数据不为badcase。
5.根据权利要求1所述的方法,其特征在于,所述基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,具体包括:
调用badcase筛选模型,所述badcase筛选模型为:以在建立所述badcase筛选规则所使用的所述历史标注badcase对话样本集,以及所述历史标注badcase对话样本集中各个badcase对话样本文本的badcase特征信息作为训练样本,以对所述badcase对话样本文本的badcase标注结果为样本标签进行训练得到;
将所述待识别人机对话数据和所述对话特征信息输入至所述badcase筛选模型,获得所述待识别人机对话数据为badcase的概率分值;
判断所述概率分值是否小于预设阈值,所述预设阈值为预设的badcase出现的概率;
如果是,则确定所述待识别人机对话数据为badcase;
如果否,则确定所述待识别人机对话数据不为badcase。
6.根据权利要求1~5任意一项所述的方法,其特征在于,还包括:当所述待识别人机对话数据为badcase时,将所述待识别人机对话数据添加至所述历史标注badcase对话样本集中。
7.一种识别人机对话中坏例的装置,其特征在于,所述装置包括:
获取单元,用于获取待识别人机对话数据;
提取单元,用于从所述待识别人机对话数据中,提取出对话特征信息;
识别单元,用于基于所述对话特征信息以及预先建立的坏例badcase筛选规则,获得所述待识别人机对话数据是否是badcase的识别结果,其中,所述badcase筛选规则基于历史标注badcase通话样本集确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海优扬新媒信息技术有限公司,未经上海优扬新媒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911325819.4/1.html,转载请声明来源钻瓜专利网。





