[发明专利]广告主的分类方法及系统有效
| 申请号: | 201810332173.1 | 申请日: | 2018-04-13 |
| 公开(公告)号: | CN108764961B | 公开(公告)日: | 2022-12-23 |
| 发明(设计)人: | 乔方杰;吴文伟;何爱龙 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/35;G06F40/284 |
| 代理公司: | 北京卓岚智财知识产权代理有限公司 11624 | 代理人: | 任漱晨 |
| 地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 广告 分类 方法 系统 | ||
1.一种广告主的分类方法,其特征在于,所述方法包括:
将待分类的各广告主发布的每条网页数据表征为对应的数值矩阵;
构建不同类别的卷积核,针对每一个待分类的广告主,执行如下操作:
对当前广告主发布的每条网页数据的数值矩阵进行特征提取,得到每条网页数据的各特征矩阵;
将每条网页数据的各特征矩阵进行分类,得到每条网页数据的预测类别;
对当前广告主的各网页数据的预测类别进行投票,得到当前广告主的类别;
其中,所述对当前广告主发布的每条网页数据的数值矩阵进行特征提取,得到每条网页数据的各特征矩阵,具体包括:
针对每条网页数据,执行如下操作:
对当前广告主发布的当前网页数据的数值矩阵,分别将每个卷积核与该数值矩阵进行卷积计算,得到各卷积核下的该数值矩阵的各卷积;
针对同一卷积核下的该数值矩阵的各卷积,分别进行偏置计算,得到同一卷积核下的该数值矩阵的各偏置;
对同一卷积核下的该数值矩阵的各偏置分别运用激活函数,得到同一卷积核下的该数值矩阵的各原始特征向量;
将同一卷积核下的该数值矩阵的各原始特征向量堆积后进行最大池化,得到对应当前网页数据的各特征矩阵;
其中,数值矩阵的宽度为切词后单词的数字表示,高度为句子长度,数值矩阵的每个行向量都唯一对应一个单词,并且按照单词在句子中的顺序,从上到下的排列单词对应的行向量;卷积核的宽度与单词宽度相同,卷积方向朝下。
2.根据权利要求1所述的广告主的分类方法,其特征在于,所述将待分类的各广告主发布的每条网页数据表征为对应的数值矩阵,之前还包括:
获取待分类的各广告主发布的每条原始网页数据;
对各广告主发布的每条原始网页数据进行预处理,得到各广告主发布的每条网页数据。
3.根据权利要求1所述的广告主的分类方法,其特征在于,所述将待分类的各广告主发布的每条网页数据表征为对应的数值矩阵,具体包括:
构建一个随机矩阵;在语料库中的任一单词都可被随机矩阵的某个子块唯一表示;
针对每一个待分类的广告主发布的每条网页数据,执行如下操作:
对当前广告主发布的当前网页数据进行分词,得到当前网页数据对应的至少一个单词;
基于随机矩阵,分别查找到当前网页数据对应的每个单词对应的子块;
将当前网页数据对应的每个单词对应的子块组合成一个二维矩阵;所述二维矩阵为当前广告主发布的当前网页数据的数值矩阵。
4.根据权利要求1所述的广告主的分类方法,其特征在于,所述将每条网页数据的各特征矩阵进行分类,得到每条网页数据的预测类别,具体包括:
通过softmax回归模型对每条网页数据的各特征矩阵进行分类,得到当前广告主发布的每条网页数据的预测类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810332173.1/1.html,转载请声明来源钻瓜专利网。





