[发明专利]一种基于word2vec的车系相关度确定的方法及装置在审
申请号: | 201811432873.4 | 申请日: | 2018-11-28 |
公开(公告)号: | CN109635383A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 陈希厚;邹晓明;马擘;庞敏辉;陈忠元;邱慧 | 申请(专利权)人: | 优信拍(北京)信息科技有限公司 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06Q10/10 |
代理公司: | 北京知联天下知识产权代理事务所(普通合伙) 11594 | 代理人: | 王冲 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车系 相关度 建模数据 过滤处理 构建 建模 省力 省时 展示 | ||
1.一种基于word2vec的车系相关度确定的方法,其中,所述方法包括:
收集建模数据;
对收集的建模数据进行过滤处理;
根据过滤处理后的建模数据构建车系相关模型;
计算车系相关模型的相关度;
根据相关度展示相关车系。
2.根据权利要求1所述的车系相关度确定的方法,其中,所述建模数据包括:车系点击量数据、车源序列数据和车系序列数据。
3.根据权利要求1所述的车系相关度确定的方法,其中,所述过滤处理包括删除数据处理和存储数据处理。
4.根据权利要求3所述的车系相关度确定的方法,其中,所述删除数据包括删除不符合建模要求的数据;所述存储数据包括存储符合建模要求的数据。
5.根据权利要求4所述的车系相关度确定的方法,其中,所述不符合建模要求包括用户的点击序列长度与其中所点击的不同的车系个数比值超过预定阈值。
6.根据权利要求1所述的车系相关度确定的方法,其中,所述构建车系相关模型包括通过word2vec中的skip-gram模型建立车系相关模型和通过word2vec中的HierarchicalSoftmax优化方法优化所述车系相关模型。
7.根据权利要求6所述的车系相关度确定的方法,其中,在训练建立所述车系相关模型时,将过滤处理后的车系点击序列集合输入到所述skip-gram模型中,对所述skip-gram模型中用于获取输入输出的滑动窗口大小以及词向量的维度大小中的一个或多个进行调节。
8.根据权利要求1所述的车系相关度确定的方法,其中,所述计算车系相关模型的相关度即基于词向量确定车系相关度。
9.根据权利要求8所述的车系相关度确定的方法,其中,所述基于词向量确定车系相关度包括:
确定车系相关模型对应的词向量;
计算所述词向量表示的距离数值;
所述距离数值即为所述车系相关模型的相关度。
10.根据权利要求1所述的车系相关度确定的方法,其中,所述展示相关车系即根据车系相关度提取展示车系相关度高的车系信息。
11.一种确定车系相关度的装置,其中,所述装置包括:
建模数据收集模块,用于收集建模数据;
数据处理模块,用于过滤收集到的建模数据;
模型构建模块,用于根据过滤处理后的建模数据构建车系相关模型;
计算模块,用于计算所述车系相关模型的车系相关度;
结果输出模块,用于提取所述计算模块计算保存的所述车系相关度和所述车系相关度对应的车系信息。
12.根据权利要求11所述的确定车系相关度的装置,其中,所述建模数据收集模块用于收集车系点击量数据、车源序列数据和车系序列数据。
13.根据权利要求11所述的确定车系相关度的装置,其中,所述数据处理模块包括数据删除模块和数据保存模块;
所述数据删除模块,用于删除不符合建模要求的数据;
所述数据保存模块,用于保存符合建模要求的数据。
14.根据权利要求11所述的确定车系相关度的装置,其中,所述模型构建模块包括建模模块和模型优化模块;
所述建模模块,用于基于word2vec中的skip-gram模型构建所述车系相关模型;
所述模型优化模型,基于word2vec中的Hierarchical Softmax优化方法对所述车系相关模型进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优信拍(北京)信息科技有限公司,未经优信拍(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811432873.4/1.html,转载请声明来源钻瓜专利网。