[发明专利]SEM关键词生成方法、系统、设备和存储介质在审
申请号: | 202210061054.3 | 申请日: | 2022-01-19 |
公开(公告)号: | CN114385778A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 葛万峰;鲁玲;周海燕 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/335;G06F16/35;G06F16/36;G06N3/08 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 马涛;罗朗 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | sem 关键词 生成 方法 系统 设备 存储 介质 | ||
本发明公开了一种SEM关键词生成方法、系统、设备和存储介质。SEM关键词生成方法包括:获取与目标产品对应的多条搜索文本;针对每一条搜索文本,对搜索文本进行切词,得到搜索分词和与搜索分词对应的第一属性;基于第一属性生成与搜索文本对应的第一属性序列;获取目标产品的产品文本;基于产品文本、搜索分词和第二属性序列生成SEM关键词。本发明通过大量搜索文本得到搜索分词和对应的属性,通过属性生成属性序列,属性序列和搜索分词用于表征用户的搜索习惯,针对目标产品,筛选出对应的常见属性序列,然后筛选出各属性下常见的搜索分词,基于属性序列将产品与搜索分词进行拼接,从而自动的生成符合用户搜索习惯的SEM关键词。
技术领域
本发明涉及文本处理领域,特别涉及一种SEM(搜索引擎营销)关键词生成方法、系统、设备和存储介质。
背景技术
随着互联网的高速发展,网络成为最大的信息载体和交流平台,搜索引擎作为一种有效的信息获取工具,是很多人获取信息的重要途径。SEM(Search Engine Marketing,搜索引擎营销)正是通过搜索引擎返回的结果,尽可能将产品信息传递给目标群体。现有技术中,要么通过以往的经验,直接人工生成SEM关键词,要么基于预先设定的模板对关键词进行分类,然后拼接生成SEM关键词,而这两种方式都需要人工干预,生成的SEM关键词容易受到主观因素影响,使得很多SEM关键词并不符合用户的搜索习惯。
发明内容
本发明要解决的技术问题是为了克服现有技术中SEM关键词不符合用户搜索习惯的缺陷,提供一种SEM关键词生成方法、系统、设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
根据本发明的第一方面,提供一种SEM关键词生成方法,包括以下步骤:
获取与目标产品对应的多条搜索文本;
针对每一条搜索文本,根据预设的分词与属性的对应关系,对所述搜索文本进行切词,得到搜索分词和与所述搜索分词对应的第一属性;
基于所述第一属性生成与所述搜索文本对应的第一属性序列;
基于所述产品文本、所述搜索分词和第二属性序列生成SEM关键词,其中,所述第二属性序列基于所述产品文本、所述搜索分词和所述第一属性序列得到。
较佳地,所述基于所述产品文本、所述搜索分词和第二属性序列生成SEM关键词的步骤包括:
判断所述产品文本是否存在直接对应的产品分词和第二属性,若是,则获取所述产品分词和所述第二属性;否则根据预设的分词与属性的对应关系,对所述产品文本进行切词得到所述产品分词和与所述产品分词对应的第二属性;
从所述第一属性序列中筛选第二属性序列,其中,所述第二属性序列中所包含的第一属性覆盖所述第二属性;
根据所述第二属性序列的属性顺序,分别将与所述第二属性序列的属性对应的所述搜索分词和所述产品分词进行拼接,生成SEM关键词;
和/或,所述基于所述产品文本、所述搜索分词和第二属性序列生成SEM关键词的步骤之前还包括对所述第一属性序列和所述搜索分词进行预筛选;
所述对所述第一属性序列和所述搜索分词进行预筛选的步骤包括:
分别统计所述第一属性序列的数量;
筛选数量最多的N个第一属性序列,其中,N为正整数;
分别统计N个第一属性序列中每个第一属性下的所述搜索分词的数量;
筛选数量最多的K个搜索分词,其中,K为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210061054.3/2.html,转载请声明来源钻瓜专利网。