[发明专利]一种广告投放方法及系统在审
| 申请号: | 201910864507.4 | 申请日: | 2019-09-12 |
| 公开(公告)号: | CN110706021A | 公开(公告)日: | 2020-01-17 |
| 发明(设计)人: | 孙兴帅 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/36;G06F16/33 |
| 代理公司: | 11624 北京卓岚智财知识产权代理事务所(特殊普通合伙) | 代理人: | 郭智 |
| 地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 广告投放 搜索 广告商业 权重 广告行业 索引词 相关度 概念模型 用户搜索 预先确定 | ||
1.一种广告投放方法,其特征在于,所述方法包括:
确定用户搜索文本中每个词的权重值;
根据所述搜索文本中每个词的权重值与预先确定的广告行业对应的广告商业概念的索引词及索引词的权重值,确定所述搜索文本与广告商业概念的相关度;
根据所述搜索文本与广告商业概念的相关度确定所述搜索文本对应的广告行业并进行广告投放。
2.如权利要求1所述的广告投放方法,其特征在于,所述搜索文本中每个词的权重值为搜索文本中每个词的词频-逆文本频率TF-IDF值。
3.如权利要求2所述的广告投放方法,其特征在于,所述广告行业对应的广告商业概念的索引词及索引词的权重值,通过以下方法确定:
获取维基百科的可扩展标记语言XML数据,从中抽取广告行业对应的广告商业概念及概念之间的语义关系,并抽取概念的文本内容;
对概念的文本内容做分词、去掉停用词处理;
计算处理后的词相对于概念的TF-IDF值,并按TF-IDF值由高到低排序;
选择TF-IDF值最高的设定个数的词作为对应的概念的索引词,索引词对应的TF-IDF值作为该索引词的权重值。
4.如权利要求3所述的广告投放方法,其特征在于,所述词相对于概念的TF-IDF值通过下式计算:
tfidfi,j=tfi,j×idfi,j,
其中,词频ni,j表示文本j中词i出现的次数;∑knk,j表示文本j中所有词的出现次数之和,k表示文本j中的词;
逆文本频率|D|表示概念对应的所有文本的总数目,|{j:ti∈dj}|表示概念对应的所有文本中包含词i的文件dj的数目,ti表示概念对应的所有文本中与词i相同的词。
5.如权利要求4所述的广告投放方法,其特征在于,所述根据所述搜索文本中每个词的权重值与预先确定的广告行业对应的广告商业概念中包含的词及词的权重值,确定所述搜索文本与广告商业概念的相关度,包括:
通过下式确定所述搜索文本与广告商业概念的相关度R:
其中,T表示所述搜索文本中的词的集合;
wi表示所述搜索文本中的第i个词;
vi表示所述搜索文本的词wi在所述搜索文本中的权重值;
kj表示广告商业概念中与词wi相同的词在该广告商业概念中的权重值。
6.一种广告投放系统,其特征在于,所述系统包括:
搜索文本信息确定单元,用于确定用户搜索文本中每个词的权重值;
相关度确定单元,用于根据所述搜索文本中每个词的权重值与预先确定的广告行业对应的广告商业概念的索引词及索引词的权重值,确定所述搜索文本与广告商业概念的相关度;
广告投放单元,用于根据所述搜索文本与广告商业概念的相关度确定所述搜索文本对应的广告行业并进行广告投放。
7.如权利要求6所述的广告投放系统,其特征在于,所述搜索文本信息确定单元中,搜索文本中每个词的权重值为搜索文本中每个词的词频-逆文本频率TF-IDF值。
8.如权利要求7所述的广告投放系统,其特征在于,还包括索引词权重值确定单元,用于:
获取维基百科的可扩展标记语言XML数据,从中抽取广告行业对应的广告商业概念及概念之间的语义关系,并抽取概念的文本内容;
对概念的文本内容做分词、去掉停用词处理;
计算处理后的词相对于概念的TF-IDF值,并按TF-IDF值由高到低排序;
选择TF-IDF值最高的设定个数的词作为对应的概念的索引词,索引词对应的TF-IDF值作为该索引词的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864507.4/1.html,转载请声明来源钻瓜专利网。





