[发明专利]实时语音交互处理方法及装置、电子设备、存储介质在审
| 申请号: | 201911274649.1 | 申请日: | 2019-12-12 |
| 公开(公告)号: | CN111143557A | 公开(公告)日: | 2020-05-12 |
| 发明(设计)人: | 赵群;宁洪珂;夏小强 | 申请(专利权)人: | 北京小米移动软件有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G10L15/22;G10L15/26 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实时 语音 交互 处理 方法 装置 电子设备 存储 介质 | ||
本公开是关于一种实时语音交互处理方法及装置、电子设备、存储介质。一种实时语音交互处理方法,包括:接收语音会话信息,确定所接收的语音会话信息中是否存在预设的敏感内容;在所述语音会话信息中未存在所述敏感内容时,返回与所述语音会话信息相匹配的语音回复数据;在所述语音会话信息存在所述敏感内容时,返回与所述敏感内容相匹配的语音提醒数据,所述语音提醒数据用于提醒所述语音会话信息中涉及敏感内容。本实施例中可以在语音会话信息存在敏感内容时回复语音提醒数据,可以及时提醒用户,从而使用户及时中止该敏感话题,避免出现用户多次重复的问题,有利于提升用户使语音交互的体验。
技术领域
本公开涉及语音处理技术领域,尤其涉及一种实时语音交互处理方法及装置、电子设备、存储介质。
背景技术
随着语音交互技术的发展,聊天机器人的应用越来越广泛,例如搭载到电子设备中的各种聊天机器人,这样可以方便用户与聊天机器人交互,由机器人帮忙用户查找相应的信号。
实际应用中,聊天机器人可能面对不同的用户,各用户的素质参差不齐。例如,在聊天过程中,部分用户可能会询问一些敏感话题,例如政治事件、反动言论、黄色话题或者辱骂等话题,若聊天机器人反馈信息,则会违规或违法,若聊天机器人不反馈信号,则用户可能会认为机器人故障或者没有听清,继续询问,不利于提升用户体验。
发明内容
本公开提供一种实时语音交互处理方法及装置、电子设备、存储介质,以解决相关技术的不足。
根据本公开实施例的第一方面,提供一种实时语音交互处理方法,包括:
接收语音会话信息,确定所接收的语音会话信息中是否存在预设的敏感内容;
在所述语音会话信息中未存在所述敏感内容时,返回与所述语音会话信息相匹配的语音回复数据;在所述语音会话信息存在所述敏感内容时,返回与所述敏感内容相匹配的语音提醒数据,所述语音提醒数据用于提醒所述语音会话信息中涉及敏感内容。
可选地,确定所获取的语音会话信息中是否存在预设的敏感内容包括:
将所述语音会话信息转换成文本会话数据;
确定所述文本会话数据是否存在预设的敏感内容。
可选地,确定所述文本会话数据是否存在预设的敏感内容包括:
获取数据库中的敏感内容,并构建成字典树结构;
基于所述字典树结构匹配所述文本会话数据,得到匹配结果,所述匹配结果表示所述文本会话数据中是否存在预设的敏感内容。
可选地,所述数据库中的敏感内容,通过以下步骤获取:
获取预先训练的文本分类器;
将待分类的文本会话数据输入到所述文本分类器,由所述文本分类器获取各文本会话数据的分类;所述分类为正常类型和异常类型,所述异常类型是指文本会话数据内包含敏感内容;
从所述分类为异常类型的文本会话数据中提取出敏感内容;
将提取出的敏感内容存储到所述数据库。
可选地,所述文本分类器通过以下步骤训练,包括:
获取包含不同类型敏感内容的文本会话数据,得到多个文本会话训练集合,其中包含相同类型的敏感内容的文本会话数据构成一个文本会话训练集合;
利用所述文本会话训练集合训练预设的文本分类器,直至所述文本分类器的损失函数的输出值小于设定误差阈值为止。
可选地,所述文本分类器获取各文本会话数据的分类之后,所述方法还包括:
将分类的预测值大于预测值阈值的文本会话数据进行显示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911274649.1/2.html,转载请声明来源钻瓜专利网。





