[发明专利]一种基于关键词识别的无线电识别方法有效
| 申请号: | 201810810283.4 | 申请日: | 2018-07-23 |
| 公开(公告)号: | CN109104258B | 公开(公告)日: | 2020-09-18 |
| 发明(设计)人: | 雒瑞森;龚晓峰;王琛;余艳梅;余勤;费绍敏;涂海燕;程鹏;冯谦;侯长江;王浩宇;孙睿;张浩;林立峰;陈泓儒;任小梅;肖美龄 | 申请(专利权)人: | 四川大学 |
| 主分类号: | H04H20/14 | 分类号: | H04H20/14;H04H60/29;G10L15/26;G06F40/247 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 何凡;李蕊 |
| 地址: | 610000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 关键词 识别 无线电 方法 | ||
本发明公开了一种基于关键词识别的无线电识别方法,其包括以下步骤:S1、建立声学模型,将无线电广播识别为文字;S2、建立语言模型,提取所识别文字中的关键词;S3、根据提取的关键词判断该无线电广播是否合法。本发明的无线电识别可以实现自动化,极大的节省了成本、提升了效率;本方法针对无线电广播信号的特点,能够最大化的满足不同需求;本方法可以离线使用,特别适合于需要保密的项目中;并且能在存在背景音乐或其他噪声的情况下进行识别,便于应用于更广泛的场景当中。
技术领域
本发明涉及无线电识别领域,具体涉及一种基于关键词识别的无线电识别方法。
背景技术
由于无线电广播技术自身的开放性,所有有发射需求的用户,只需要占据特定的频段,即可通过发射信号进行广播。因此,时常有出于不同目的用户,在批准发射的频率之外,擅自占据频段进行广播发射(俗称“黑广播”,即非法广播)。在这之中,出于经济目的非法广播发射尤为明显,其内容以售卖假冒伪劣产品居多,严重扰乱经济秩序。另外,即便是一些非主观恶意的私占频段发射(如无线电爱好者自行搭建平台),也会扰乱正常电子通讯的运转,在某些情况下甚至会干扰关键性通讯设备(如飞机飞航通讯频段),引发严重的安全隐患。因此,进行有效的无线电识别,进而便于无线电电磁频谱管控是一项意义重大的课题。
传统的无线电识别主要是基于人工收听并识别的方法,具有成本高、效率低、操作人员疲劳易引发失误等缺点。
现有语音识别模型通常针对整句识别、语义判定而设计的,其大部分只提供线上使用功能,无法离线使用,可以移植性差,且整句识别会使得识别成功率大大降低,存在噪声的情况下识别成功率也很低,不适用于无线电识别领域。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于关键词识别的无线电识别方法解决了现有无线电识别方法成本高效率低的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于关键词识别的无线电识别方法,其包括以下步骤:
S1、建立声学模型,将无线电广播识别为文字;
S2、建立语言模型,提取所识别文字中的关键词;
S3、根据提取的关键词判断该无线电广播是否合法。
进一步地,步骤S1的具体方法为:
采用CMU sphinx模型的基础中文模型作为基底,通过逐句分音节标注样本信号,基于最大后验概率对该基底进行参数自适应操作,得到声学模型,其表达式如下:
其中x表示某一个音节;p(x)为输出某一个音节的概率;P(m)为高斯概率密度函数的权值;μm和σm2是高斯分布的参数;P(x|m)为第m个模块下输出某一个音节的概率;M为基础中文模型的高斯子模型总数量;m为第m个基础中文模型的高斯子模型;I为单位矩阵;N(·)为多元高斯分布。
进一步地,步骤S2的具体方法为:
根据CMU sphinx词典及语言模型生成器建立语言模型,将样本词作为提取条件,提取与样本词相同的词作为关键词,其具体步骤为:
S2-1、建立文本文件,在文本文件的每一行中加入样本关键词;
S2-2、通过在线语言模型生成工具对文本文件进行语言模型及词典的生成,完成语言模型的建立;
S2-3、通过语言模型提取所识别文字中的关键词。
进一步地,步骤S3的具体方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810810283.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线信号检测方法及装置
- 下一篇:一种多传感器对时同步系统和方法





