[发明专利]位置嵌入解释方法、装置、计算机设备及存储介质有效
| 申请号: | 202110334812.X | 申请日: | 2021-03-29 |
| 公开(公告)号: | CN113032567B | 公开(公告)日: | 2022-03-29 |
| 发明(设计)人: | 丁冬睿;陈勐;张凯;杨光远 | 申请(专利权)人: | 广东众聚人工智能科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/30;G06K9/62 |
| 代理公司: | 北京中和立达知识产权代理有限公司 11756 | 代理人: | 祝妍 |
| 地址: | 510000 广东省珠海*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 位置 嵌入 解释 方法 装置 计算机 设备 存储 介质 | ||
1.一种位置嵌入解释方法,其特征在于,包括:
S10:获取原始数据集,并对所述原始数据集进行预处理,其中,预处理后的原始数据集由多个位置数据和多个位置类别数据组成,每个位置数据对应一个位置类别数据;
S20:获取所述多个位置数据对应的多个位置,其中,每个位置对应至少一个位置数据;根据所述预处理后的原始数据集中的多个位置上下文序列,利用Skip-gram模型学习得到多个位置嵌入向量,其中,每个位置对应一个位置嵌入向量;
S30:获得所述多个位置类别数据对应的多个位置类别,其中,每个位置类别对应至少一个位置类别数据;利用Skip-gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中,其中,每个位置类别对应一个位置类别嵌入向量;
S40:按照预定的规则,将每个位置嵌入向量从所述原始向量空间转换到语义向量空间,得到所述每个位置嵌入向量对应的位置语义表示,其中,所述语义向量空间为以M个位置类别为维度的向量空间,M为大于或等于1的整数;
其中,所述预处理后的原始数据集为用户轨迹数据,所述多个位置为所述用户去过的多个地点,所述多个位置类别为用于用户画像的多个语义类别,所述多个位置类别嵌入向量为用于用户画像的多个语义类别嵌入向量;
在步骤S30中,所述利用Skip-gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中,包括:
S310:将每个位置上下文序列中的多个位置数据对应的多个位置类别数据作为位置类别的上下文,构造一个位置类别上下文序列;由所述多个位置上下文序列,构造多个位置类别上下文序列;
S320:根据所述多个位置上下文序列和所述多个位置类别上下文序列,利用Skip-gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中;
在步骤S40中,所述预定的规则为:将每个位置嵌入向量与所述M个位置类别之间的相似性分数作为所述每个位置嵌入向量的位置语义表示;
所述位置语义表示为其中,
其中,Sim(wi,cm)表示给定位置wi与位置类别cm(m=1,…i,…M)之间的相似性评分,cos(wi,cm)表示wi和cm之间的余弦相似度,λ表示一个阈值;
其中,表示给定位置wi在所述原始向量空间中的位置嵌入向量,表示位置类别cm在所述原始向量空间中的位置类别嵌入向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东众聚人工智能科技有限公司,未经广东众聚人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110334812.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种天气预报方法、装置、设备及存储介质
- 下一篇:一种用于钢构厂的切割装置





