[发明专利]自动验证通信号码的方法、系统、设备及存储介质有效
申请号: | 201810853313.X | 申请日: | 2018-07-30 |
公开(公告)号: | CN108959646B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 华吉春 | 申请(专利权)人: | 携程旅游信息技术(上海)有限公司 |
主分类号: | G06F16/00 | 分类号: | G06F16/00;G10L15/26 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;盛晓颖 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 验证 通信 号码 方法 系统 设备 存储 介质 | ||
1.一种自动验证通信号码的方法,其特征在于,包括以下步骤:
S10、使用爬虫技术在目标网站中使用关键字进行搜索,爬取搜索结果中的通信号码以及与所述通信号码关联的多个号码特征字段,所述号码特征字段包括文本字段;
S30、对爬取的通信号码进行呼叫并获取应答语音;
S40、将所述应答语音转换为语音文本,将号码特征字段中的文本字段与所述语音文本进行匹配,若匹配成功则执行S50,若匹配失败则执行步骤S60;
S50、判断通信号码正确;
S60、判断通信号码异常,输出判断结果。
2.如权利要求1所述的自动验证通信号码的方法,其特征在于,所述步骤S10包括:
S11、在目标网站中使用关键字进行搜索;
S12、根据搜索结果的超文本标记语言的标签语义判断搜索结果的类型;
S13、根据所述搜索结果的类型使用对应预设的内容爬取模式提取所述搜索结果中的通信号码以及号码特征字段。
3.如权利要求2所述的自动验证通信号码的方法,其特征在于,所述步骤S11包括:从网页投放系统中获取所述关键字。
4.如权利要求1所述的自动验证通信号码的方法,其特征在于,
所述步骤S50包括判断通信号码正确,存储步骤S40中匹配成功后的所述通信号码以及号码特征字段。
5.如权利要求4所述的自动验证通信号码的方法,其特征在于,所述号码特征字段包括时间戳,步骤S10后还包括步骤:
S21、在存储数据中查找爬取的所述通信号码,若未查找到所述通信号码则执行步骤S30,若查找到所述通信号码则执行步骤S22;
S22、计算爬取的时间戳与存储数据中通信号码对应的时间戳之差是否超过阈值,如不超过则执行步骤S50,如超过则执行步骤S30。
6.如权利要求1所述的自动验证通信号码的方法,其特征在于,所述步骤S30包括:读取爬取的通信号码,使用IP语音通信呼出所述通信号码并开始录音,检测到挂机提示音后停止录音。
7.如权利要求1所述的自动验证通信号码的方法,其特征在于,步骤S40包括:S41、通过音频频谱分析判断应答语音中是否包含人声频段,如包含则执行步骤S42,不包含则执行步骤S60;S42、将所述应答语音进行文字转换获得语音文本;S43、提取所述语音文本中的特征名词,将号码特征字段中的文本字段与所述特征名词进行匹配。
8.一种自动验证通信号码的系统,其特征在于包括:
爬虫模块,所述爬虫模块使用爬虫技术在目标网站中使用关键字进行搜索,爬取搜索结果中的通信号码以及与所述通信号码关联的多个号码特征字段,所述号码特征字段包括文本字段;
呼叫模块,所述呼叫模块用于对爬取的通信号码进行呼叫并获取应答语音;
语音转换模块,所述语音分析模块用于将所述应答语音转换为语音文本;
匹配分析模块,所述匹配分析模块用于将号码特征字段中的文本字段与所述语音文本进行匹配,如匹配成功则判断通信号码正确,如匹配失败则判断通信号码异常,输出判断结果。
9.一种自动验证通信号码的设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述自动验证通信号码的方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现权利要求1至7中任意一项所述自动验证通信号码的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术(上海)有限公司,未经携程旅游信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810853313.X/1.html,转载请声明来源钻瓜专利网。