[发明专利]智能销售信息推荐方法及系统有效
| 申请号: | 202211264154.2 | 申请日: | 2022-10-17 |
| 公开(公告)号: | CN115329207B | 公开(公告)日: | 2023-03-21 |
| 发明(设计)人: | 卫晓祥;吴传文;唐绍祖 | 申请(专利权)人: | 启客(北京)科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/295;G06F18/214 |
| 代理公司: | 北京中誉至诚知识产权代理事务所(普通合伙) 11858 | 代理人: | 张平力 |
| 地址: | 100193 北京市海淀区西小口路66号中关村东升科技园·*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能 销售 信息 推荐 方法 系统 | ||
1.一种智能销售信息推荐方法,其特征在于,包括:
获取当前企业客户名单以及企业特征数据集;其中,所述企业特征数据集至少包括N个不同企业的特征数据,所述企业客户名单包含所述N个不同企业中的M个企业,M小于N;
将所述N个不同企业的特征数据输入预测模型,以得到所述N个不同企业的第一分值;其中,所述预测模型是基于第一样本数据集对XGBoost模型训练得到的,所述第一样本数据集包括第一训练集和第一验证集,所述第一训练集包括第一正样本和第一负样本,所述第一验证集包括第二正样本和第二负样本,所述第一正样本包含从所述M个企业的特征数据中随机抽取的指定数量的特征数据,所述第二正样本包含从所述M个企业的特征数据中抽取后剩余数量的特征数据,所述指定数量小于所述剩余数量,所述第一负样本和第二负样本均包含以预设百分比R从所述N个不同企业的特征数据中随机抽取的P个特征数据得到的随机负样本以及难分负样本;其中,R=P/N=1-a,a表示所述N个不同企业中能够成为潜在意向企业客户的比值;
基于所述N个不同企业的第一分值,确定潜在的目标企业客户;以及
获取所述N个不同企业各自的企业介绍文本;
将所述N个不同企业各自的企业介绍文本输入命名实体识别模型,以识别得到所述N个不同企业对应的预设名词,所述预设名词包括至少一个业务名词和/或产品名词;其中,所述命名实体识别模型是基于样本企业介绍文本对BERT模型预先训练得到的;
计算所述N个不同企业对应的预设名词各自的第一逆向文件频率IDF并形成第一IDF字典,同时计算所述N个不同企业中每个企业对应的预设名词的第一词频TF并形成第一TF字典;
基于所述第一IDF字典、所述第一TF字典生成所述N个不同企业中每个企业对应的第一TF-IDF以形成第一TF-IDF字典;第一TF-IDF字典即各企业TF-IDF字典中,每个企业的名词i的TF-IDF值等于该名词i的TF值乘以对应的IDF值;
基于所述企业客户名单,从识别得到的所述N个不同企业的预设名词中选择确定所述M个企业对应的所有预设名词,计算所述M个企业对应的所有预设名词各自的第二词频TF并形成第二TF字典;
基于所述第二TF字典、所述第一IDF字典,生成所述M个企业对应的所有预设名词各自的第二TF-IDF以形成第二TF-IDF字典;
基于所述第二TF-IDF字典以及所述第一TF-IDF字典,对所述N个不同企业中每个企业对应的预设名词的第一TF-IDF和第二TF-IDF进行加权求和计算,以得到所述N个不同企业中每个企业对应的第二分值;
基于所述N个不同企业中每个企业的第二分值,以及所述N个不同企业的第一分值,确定所述N个不同企业中每个企业的最终分值;
基于所述N个不同企业中每个企业的最终分值,确定潜在的目标企业客户。
2.根据权利要求1所述的方法,其特征在于,所述N个不同企业的特征数据包括企业画像特征数据和企业基本特征数据;在使用所述第一训练集对所述XGBoost模型的训练过程中,使用所述第一验证集对所述XGBoost模型的输出结果进行验证,同时观测模型评价指标是否满足预设条件,若否,则调节所述XGBoost模型的超参数以及增加所述企业画像特征数据来重新训练。
3.根据权利要求2所述的方法,其特征在于,所述基于所述N个不同企业中每个企业的第二分值,以及所述N个不同企业的第一分值,确定所述N个不同企业中每个企业的最终分值,包括:
基于所述N个不同企业中每个企业的第二分值以及所述N个不同企业的第一分值,确定所述N个不同企业各自的分值特征数据;
将所述N个不同企业各自的分值特征数据输入逻辑回归模型,得到所述N个不同企业中每个企业的最终分值;其中,所述逻辑回归模型是基于第二样本数据集对原始的逻辑回归模型训练得到的,所述第二样本数据集包括第二训练集和第二验证集,所述第二训练集包括第三正样本和第三负样本,所述第二验证集包括第四正样本和第四负样本;
其中,所述第三正样本包含从所述N个不同企业的分值特征数据中匹配的所述M个企业的分值特征数据中随机抽取的所述指定数量的分值特征数据;所述第四正样本包含从所述M个企业的分值特征数据中抽取后所述剩余数量的分值特征数据;所述第三负样本和第四负样本均包含以所述预设百分比R从所述N个不同企业的分值特征数据中随机抽取的P个分值特征数据得到的随机负样本以及难分负样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于启客(北京)科技有限公司,未经启客(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211264154.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锂电池电芯模组的安全防护结构
- 下一篇:一种铁附件生产用焊接定位装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





