[发明专利]一种基于人工神经网络模型和UA信息的终端识别方法在审
申请号: | 201711011866.2 | 申请日: | 2017-10-25 |
公开(公告)号: | CN107766928A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 郑炎 | 申请(专利权)人: | 福建富士通信息软件有限公司 |
主分类号: | G06N3/02 | 分类号: | G06N3/02;G06F17/27 |
代理公司: | 福州市鼓楼区京华专利事务所(普通合伙)35212 | 代理人: | 宋连梅 |
地址: | 350000 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工 神经网络 模型 ua 信息 终端 识别 方法 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种基于人工神经网络模型和UA信息的终端识别方法。
背景技术
目前电信DPI项目需要针对用户终端类型来进行大数据统计分析,其中用户终端类型的识别是整个技术的关键。目前,主流的终端识别方案是根据用户上网使用的浏览器发起的HTTP的请求包头中的User-Agent信息(简称UA,中文名为用户代理,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等)来进行匹配识别。而之前的UA识别是通过匹配正则库来进行识别,需要将UA与特征正则库里的正则循环进行匹配,由于正则本身效率就比较低下,加之循环匹配(之前的正则库里收录的正则大约有3000多条,对应大约市面上3000多款用户终端,但很难将市面上的终端型号全部囊括)使得这种方式匹配的效率与准确率都不高,而且对于正则库的维护需要掌握一定的正则编写能力,而正则的编写,即使是研发人员,大部分也不是十分精通,故对于人力成本也相对较高。
发明内容
本发明要解决的技术问题,在于提供一种基于人工神经网络模型和UA信息的终端识别方法,构建一个由特征字符串作为输入神经元,终端信息作为输出神经元的人工神经网络模型,并利用神经网络传导的方式来得到最终的终端结果,使用神经网络传导比起利用一条条正则去匹配,其性能和效率得到明显提高。
本发明的问题是这样实现的:
一种基于人工神经网络模型和UA信息的终端识别方法,包括如下步骤:
步骤1、构建人工神经网络模型,在人工神经网络模型中创建复数个特征字符串、复数个终端型号以及特征字符串和终端型号之间对应的传导关系;将UA信息中的特征字符串作为输入神经元,将终端型号作为输出神经元,输入神经元与输出神经元之间通过神经网络进行传导;
步骤2、当匹配UA信息与终端时,从用户上网产生的UA信息中提取出相应的特征字符串,将所有的特征字符串通过分词算法进行分词;
步骤3、将分词后的每个特征字符串作为人工神经网络模型的输入神经元依次进行输入,由神经网络对每个输入神经元进行激发传导,当传导到某个输出神经元时,如果该输出神经元的激发值大于设定的阈值,则对应的输出神经元被激活,进入步骤4,否则,输出神经元未被激活;
步骤4、若被激发的输出神经元的个数为1,则根据该输出神经元对应的终端型号识别出其终端,并输出其终端信息;若输出神经元的个数大于1,则判断输出神经元的激发值的大小,识别出激发值最大的输出神经元,获得其对应的终端型号,根据终端型号识别出终端,并输出其终端信息。
进一步地,所述步骤4之后还包括:
步骤5、通过算法将新的特征字符串自动添加入人工神经网络模型中作为输入神经元或将新的终端型号自动添加入人工神经网络模型中作为输出神经元,并建立相应的传导关系。
进一步地,所述步骤2中将所有的特征字符串通过分词算法进行分词具体为:
将所有的特征字符串加入到一个分词Hash词库中,通过逆向最大匹配算法或正向最大匹配算法进行分词分割。
本发明的优点在于:基于人工神经网络模型的UA匹配利用的是将UA信息中的一些特征字符串与对应的终端联系起来,构建成一个由特征字符串作为输入神经元,终端信息作为输出神经元,中间相互连接传导的人工神经网络模型,并利用神经网络传导的方式来得到最终的终端结果,使用神经网络传导比起利用一条条正则去匹配,其性能和效率得到明显提高,而且人工神经网络模型是通过将已有的特征字符串,通过算法自动构建出一个逻辑数学模型,对于后期维护人员来说只需要添加新的特征字符串,再重新通过算法将特征字符串自动加入神经网络节点,而不需要去学习和维护正则库。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明的人工神经网络模型结构图。
图2为本发明一种基于人工神经网络模型和UA信息的终端识别方法执行流程图。
具体实施方式
为使得本发明更明显易懂,现以一优选实施例,并配合附图作详细说明如下。
如图1和图2所示,本发明的一种基于人工神经网络模型和UA信息的终端识别方法,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建富士通信息软件有限公司,未经福建富士通信息软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711011866.2/2.html,转载请声明来源钻瓜专利网。