[发明专利]一种航空旅客付费选座意愿画像及分析的方法在审
申请号: | 202110356803.0 | 申请日: | 2021-04-01 |
公开(公告)号: | CN113033685A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 张顺香;吴厚月;魏苏波;赵彤 | 申请(专利权)人: | 安徽理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 232001 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 航空 旅客 付费 意愿 画像 分析 方法 | ||
1.一种航空旅客付费选座意愿画像及分析的方法,其特征在于包含以下步骤:
A)数据获取及存储:从众多数据源中获取航空旅客身份信息、航班信息以及其他行为信息,并进行存储;
B)确定标签模型:对所获取的航空旅客身份信息特征、航班信息以及其他行为信息特征进行观察,从而确定对应标签模型;
C)建立标签模型:根据获取到的航空旅客身份信息特征、航班信息以及其他行为信息特征,分别进行对应标签建立,同时赋予每一标签对应的值域和标签价值(所占权重值);所述标签权重值的取值总和为1,每一对应标签的具体权重值表示该标签对航空旅客付费选座意愿的影响占比程度;标签权重为该标签的影响因子以及具体数据类别的权重的乘积;所述标签影响因子与时间有关,具体可描述为标签形成时间以及数据的来源时间,太古老的时间价值系数较低;所述数据类别的权重针对航空行程中行为信息的权重比,具体与旅客选座相关;
D)计算标签权重:利用如下算法计算标签权重Tij,得到一组综合的标签,形成用户画像:
Tij=Rij*Wij
其中,Rij表示第i个标签中第j个值得影响因子,i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息;
其计算公式如下:
其中,Kij为数据集合中与第i个标签的第j个值所对应的数据项数;
是第m条记录的标签影响因子,是第n条记录的数据时间因子,其计算公式分别如下:
其中表示第m条数据的当前时间,表示第m条数据生成时间,表示第n条数据生成距离现在的时间间隔。
数据类别权重Wij表示为:
i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息,计算方法如下:
我们采用PCA降维的方法确定数据类别的主要类别,在进行权重的具体计算,PCA降维步骤如下:
输入:数据集X=[x1,x2,x3,…xk],需要降到k维。
1)去平均值,即每一位特征减去各自的平均值。
2)计算协方差矩阵。
3)通过SVD计算协方差矩阵的特征值与特征向量。
4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。
5)将数据转换到k个特征向量构建的新空间中。
对于得到的K个特征向量就是权重较大的对应数据类别,则数据类别权重Wij计算公式如下:
Kij为降维后的数据集中第i个标签第j个值对应的数据条目数。
E)预测分析:利用上述步骤获得的数据建立分析模型,使用该分析模型刻画出航空旅客中具有付费意愿的用户画像。
2.根据权利要求1所述的一种航空旅客付费选座意愿画像及分析的方法,其特征在于:在步骤B),所述旅客身份信息的特征和行为数据的特征包括结构化数据和非结构化数据。
3.一种航空旅客付费选座意愿画像及分析的方法,其特征在于包括:
用于存储标签并生成标签模型的标签库;每一标签具有相应的值域和权重;所述标签权重值的取值总和为1,每一对应标签的具体权重值表示该标签对航空旅客付费选座意愿的影响占比程度;标签权重为该标签的影响因子以及具体数据类别的权重的乘积;所述标签影响因子与时间有关;所述数据类别的权重针对航空行程中行为信息的权重比,具体与旅客选座相关;用于计算标签权重的计算设备;该计算器利用如下算法计算标签权重Tij,得到一组综合的标签,形成用户画像;
Tij=Rij*Wij
其中,Rij表示第i个标签中第j个值得影响因子,i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息;
其计算公式如下:
其中,Kij为数据集合中与第i个标签的第j个值所对应的数据项数;
是第m条记录的标签影响因子,是第n条记录的数据时间因子,其计算公式分别如下:
其中表示第m条数据的当前时间,表示第m条数据生成时间,表示第n条数据生成距离现在的时间间隔。
数据类别权重Wij表示为:
i代表标签编号,j代表该标签中第j个值,在航空旅客数据集中,第i个标签表示第i个用户,第j个影响因子表示具体的旅客行为信息,计算方法如下:
我们采用PCA降维的方法确定数据类别的主要类别,在进行权重的具体计算,PCA降维步骤如下:
输入:数据集X=[x1,x2,x3,…xk],需要降到k维。
1)去平均值,即每一位特征减去各自的平均值。
2)计算协方差矩阵。
3)通过SVD计算协方差矩阵的特征值与特征向量。
4)对特征值从大到小排序,选择其中最大的k个。然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。
5)将数据转换到k个特征向量构建的新空间中。
对于得到的K个特征向量就是权重较大的对应数据类别,则数据类别权重Wij计算公式如下:
Kij为降维后的数据集中第i个标签第j个值对应的数据条目数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110356803.0/1.html,转载请声明来源钻瓜专利网。