[发明专利]一种基于语音语义内容分析的防电信电话诈骗方法和系统有效
申请号: | 201310094237.6 | 申请日: | 2013-03-22 |
公开(公告)号: | CN103179122A | 公开(公告)日: | 2013-06-26 |
发明(设计)人: | 马博 | 申请(专利权)人: | 马博 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04W12/12;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 750001 宁*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 语义 内容 分析 电信 电话 诈骗 方法 系统 | ||
技术领域
本发明涉及一种基于语音语义内容分析的防电信电话诈骗方法和系统,具体涉及基于电话语音语义内容识别判定诈骗或不良内容的方法及系统。
背景技术
美国的卡耐基梅隆大学在二十世纪八十年代制作的S P H I N X系统率先实现了语音识别中非特定人、连续语音、大词汇量的识别技术。随后美国的IBM 公司的Tangora5000,能够在其识别系统的词选识别率达到了97%,同时其公司的 Via Voice和Microsoft微软公司的Speech SDK 等产品都实现了中文语音识别,并且同时提供中文语音识别的开发包。同时在德国、法国等欧洲国家,也建造了许多很有特色的连续语音识别系统。
而在国内,中文的语音识别取得很大的进展。国家“863”计划把大词汇量语音识别的研究列入其计划之内。有突出代表的安徽科大讯飞公司在语音识别方面拥有40多项发明专利。
具体来讲,在语义解析上,中国各大高校研究所在研究发明上都有所建树,现有的语音和语义解析结合的公司如虫洞、科大讯飞、搜狗搜索、小i机器人、神州图骥等公司的产品。现在主要的语义识别产品使用的方法大致有三类,有基于倾向向量空间模型表示算法,有利用文本的语法,有语义、语用相结合的SOVR算法进行语句解析的,有通过SVM支持向量机和决策树算法的中文语法解析的算法。但现在并没有把语音语义,云计算和通信技术相结合的防电信欺骗产品问世。
在防电信诈骗领域中,只有几家公司拥有类似专利,这些专利只是单纯利用交换机信令消息或者追溯电话短信来源的方式对电信诈骗进行防范,并没有使用语音语义对通话内容解析,只是单纯的对通话源是否大量呼叫进行判断,也不能自动在通话中进行防范检测,并且无法对没有加入黑名单的诈骗电话准确检测,容易产生误判。
本专利的防电信电话诈骗系统则是把网络通信,中文语音解析和语义解析等技术综合,从内容上切实分析和防范电信电话诈骗,其检测的速度,时效性和准确度都较其他方法高。
发明内容
本专利提出的方法拟解决的问题,主要是对识别到的语音进行分析识别,同时对解析到的语句进行语句意思的识别,最后通过云计算平台和数据挖掘技术进行查找匹配并判定是否为诈骗行为从而实现对电话诈骗进行识别。
(1)电话输入的语音输入到通话语音输入模块,这个模块负责处理收到的通话语音并通过TCP/IP方式连接语音处理模块并把语音输入到后者。
(2)语音处理模块,主要是进行语音片段分割和对应字符匹配的预处理,该模块包括形式转换子模块,声学子模块,语音语法子模块和预处理引擎子模块。其中形式转换子模块负责对语音进行编码转换。声学子模块和语音语法子模块负责通过声学检索算法对声音进行特征匹配,预处理引擎子模块负责对匹配到的候选词通过本地数据导入方式输入到搜索轨迹中以便进行下一步的语义匹配处理。
(3)在搜索轨迹模块中,把语音处理模块输出的匹配结果备词进行语义解析并且对词义进行搜索匹配,之后通过本地数据导入方式输入到语义处理搜索模块。
(4)语义处理搜索模块包括声音段组合子模块,关键字解析子模块,和搜索引擎子模块。其中搜索引擎子模块把搜索轨迹模块输出的数据经过组合形成正确的词或者句子,然后通过关键字解析子模块识别并找出的语句中的敏感词区域方便随后的云处理模块处理,随后声音段组合子模块负责处理检查找到的敏感词对应的声音片段是否和库中的声音样本组合的片段类似,最后通过TCP/IP网络输出到云处理模块进行外部处理。
(5)云处理模块包括语义匹配处理子模块,业务处理引擎子模块,声学数据库子模块,外部数据库匹配子模块,告警预处理子模块和事件备份子模块。语义匹配处理子模块把语义处理搜索模块输出的信息进行语义查找,随后业务处理引擎子模块对找到的敏感关键字或者关键句进一步识别出意思,并且识别到关键字符或数字输入到外部匹配子模块进行查找,告警预处理子模块和事件备份子模块负责对用户,外部系统产生报警并且记录事件日志。
附图说明
图1:防电信电话诈骗处理模块概要图。
图2:语音语义识别及告警处理流程图。
具体实施方式
本专利提出的方法拟解决的问题,主要是对识别到的语音进行分析识别,同时对解析到的语句进行语句意思的识别,最后通过云计算平台和数据挖掘技术进行查找匹配并判定是否为诈骗行为从而实现对电话诈骗进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马博,未经马博许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310094237.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:合成伊伐布雷定以及其与可药用酸的加成盐的新方法
- 下一篇:自动导引搬运机器人
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法