[发明专利]话术检测方法和话术检测装置在审

申请号：	202110258035.5	申请日：	2021-03-10
公开（公告）号：	CN112634900A	公开（公告）日：	2021-04-09
发明（设计）人：	邓玉龙;刘琼琼;丁文彪;刘子韬	申请（专利权）人：	北京世纪好未来教育科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/18;G10L15/26
代理公司：	北京开阳星知识产权代理有限公司 11710	代理人：	安伟
地址：	100089 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种话术检测方法和话术检测装置。该话术检测方法包括：获取至少一个预设的热词；针对每个热词，获取所述热词对应的扩展拼音集合，所述扩展拼音集合包括所述热词的全拼，以及所述全拼对应的模糊拼音；获取所述扩展拼音集合对应的第一非标准拼音集合；获取所述第一非标准拼音集合对应的第二非标准拼音集合；获取标准拼音集合；获取待检测语音文本的拼音序列中与所述标准拼音集合中相同的目标拼音，并将所述目标拼音对应的热词作为话术检测结果。该话术检测方法能够提话术检测的准确度。

技术领域

本公开涉及语音识别技术领域，尤其涉及一种话术检测方法和话术检测装置。

背景技术

话术检测，是指对音频中的一些特定内容进行检测。其过程为输入音频文件和相关的热词列表，检测自动语音识别后的文本是否包含违禁的话或者是否包含特定热词（比如：人名、昵称等），或者是否包含赞扬、引导、纠正内容等。

现有技术中，话术检测一般采用简单的关键词匹配的方法检测音频中的热词，导致话术检测的准确性较低。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本发明实施例提供了一种话术检测方法和话术检测装置，能够提高话术检测的准确性。

第一方面，本发明实施例提供了一种话术检测方法，包括：

获取至少一个预设的热词；

针对每个热词，获取所述热词对应的扩展拼音集合，所述扩展拼音集合包括所述热词的全拼，以及所述全拼对应的模糊拼音；

获取所述扩展拼音集合对应的第一非标准拼音集合，其中，所述第一非标准拼音集合中的第一非标准拼音的部分字母与所述扩展拼音集合中的拼音的部分字母满足预设对应关系；

获取所述第一非标准拼音集合对应的第二非标准拼音集合，其中，所述第二非标准拼音集合中的各第二非标准拼音与对应的所述第一非标准拼音的编辑距离小于等于预设阈值；