[发明专利]一种基于Bi-LSTM-CRF模型的内容相关广告投放方法及系统有效
申请号: | 202110332049.7 | 申请日: | 2021-03-29 |
公开(公告)号: | CN112907301B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 景东;张大勇;卓兴良 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 黑龙江立超同创知识产权代理有限责任公司 23217 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bi lstm crf 模型 内容 相关 广告 投放 方法 系统 | ||
1.一种基于Bi-LSTM-CRF模型的内容相关广告投放方法,其特征在于,包括以下步骤:
步骤一、获取包含对商品实体进行标注的训练数据集;
步骤二、将所述训练数据集输入Bi-LSTM-CRF模型进行训练,获取最优预测模型;所述Bi-LSTM-CRF模型包括输入特征层、Bi-LSTM中间层、CRF输出层;其中,输入特征层用于将所述训练数据集每个字符分开,将分词特征、词性特征、依存关系特征、字母特征、数字特征中的一种或多种组合与字向量进行拼接作为输入特征输入Bi-LSTM中间层,所述字向量为利用Skip-gram模型预训练得到的特征词向量;Bi-LSTM中间层用于利用双向LSTM循环神经网络对输入的序列信息进行上下文特征提取,并将两个方向的LSTM特征结果进行拼接,并输入CRF输出层;CRF输出层用于生成最终的标签序列;
步骤三、将包含商品实体的待预测数据输入最优预测模型,获取预测的商品词;
步骤四、根据所述商品词匹配相关广告,获取匹配度最高的广告信息;
步骤五、将携带广告信息的广告进行投放。
2.根据权利要求1所述的一种基于Bi-LSTM-CRF模型的内容相关广告投放方法,其特征在于,步骤二在进行训练的过程中采用最大似然估计的方法寻找最优的标签序列。
3.根据权利要求2所述的一种基于Bi-LSTM-CRF模型的内容相关广告投放方法,其特征在于,步骤二中在输入特征层和Bi-LSTM中间层之间加入dropout参数用于正则化,以避免模型过拟合。
4.根据权利要求1-3中任一项所述的一种基于Bi-LSTM-CRF模型的内容相关广告投放方法,其特征在于,步骤三中预测的具体过程为通过维特比算法进行解码,获取转移概率最大的标签序列。
5.根据权利要求1所述的一种基于Bi-LSTM-CRF模型的内容相关广告投放方法,其特征在于,步骤五中投放广告的方式为采用广告与用户内容相结合的方式。
6.一种基于Bi-LSTM-CRF模型的内容相关广告投放系统,其特征在于,包括:
预测模型训练单元,用于将获取的包含对商品实体进行标注的训练数据集输入Bi-LSTM-CRF模型进行训练,获取最优预测模型;其中,Bi-LSTM-CRF模型包括输入特征层、Bi-LSTM中间层、CRF输出层;其中,输入特征层用于将所述训练数据集每个字符分开,将分词特征、词性特征、依存关系特征、字母特征、数字特征中的一种或多种组合与字向量进行拼接作为输入特征输入Bi-LSTM中间层,所述字向量为利用Skip-gram模型预训练得到的特征词向量;Bi-LSTM中间层用于利用双向LSTM循环神经网络对输入的序列信息进行上下文特征提取,并将两个方向的LSTM特征结果进行拼接,并输入CRF输出层;CRF输出层用于生成最终的标签序列;
商品词预测单元,用于将包含商品实体的待预测数据输入最优预测模型,获取预测的商品词;
广告信息匹配单元,用于根据所述商品词匹配相关广告,获取匹配度最高的广告信息;
广告投放单元,用于将携带广告信息的广告进行投放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110332049.7/1.html,转载请声明来源钻瓜专利网。