[发明专利]模型的生成方法、系统、计算机设备和存储介质有效
| 申请号: | 202110482159.1 | 申请日: | 2021-04-30 |
| 公开(公告)号: | CN113064986B | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 任小芹 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F16/903;G06N3/04;G06N3/08 |
| 代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 张曾明 |
| 地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 生成 方法 系统 计算机 设备 存储 介质 | ||
1.一种用于问题推荐的模型的生成方法,其特征在于,所述模型的生成方法包括:
获取预设用户数据库中的用户日志信息,所述用户日志信息包括用户与服务方的会话信息,所述会话信息包括若干用户问题;
对用户日志信息进行预处理,对经过预处理的用户日志信息利用二项集关联规则进行关联问题挖掘,得到关联问题集;
将关联问题集输入预先训练的神经模型中,并输出关联问题集对应的预测分数;
获取预测分数小于预设阈值的关联问题,将预测分数小于预设阈值的关联问题重新输入所述预先训练的神经模型进行训练,得到更新模型;
所述对经过预处理的用户日志信息利用二项集关联规则进行关联问题挖掘,得到关联问题集的步骤包括:
获取用户日志信息中的单通会话,并从该会话中任意选取两个用户问题组成一个二项集,判断该会话有几个用户问题,根据该会话的用户问题数量得到C(N,2)个二项集,N为所述会话中包含的N个用户问题,C为求组合数的符号;
重复操作,直至所有会话都形成二项集,将二项集汇总得到个二项集,并统计出现频率排名前预设比例的二项集作为关联二项集,其中,M为会话数,i为代表会话的编号;
对关联二项集进行结果清洗,得到关联问题集;
所述对关联二项集进行结果清洗,得到关联问题集的步骤包括:
对关联二项集进行内部去重;
采用规则匹配算法删除关联二项集的敏感信息,所述规则匹配算法为RETE算法,所述敏感信息包括电话号码和身份证号;
采用字符串编辑距离来判断关联二项集中的问题是否相关,当编辑距离大于预设阈值时,则删除编辑距离大于预设阈值的问题。
2.如权利要求1所述的模型的生成方法,其特征在于,所述将关联问题集输入预先训练的神经模型中,并输出关联问题集对应的预测分数还包括:
在神经模型中根据用户提问的习惯建立习惯权重,所述神经模型为widedeep模型。
3.如权利要求2所述的模型的生成方法,其特征在于,所述在神经模型中根据用户提问的习惯建立习惯权重的步骤还包括:
根据用户的问题记录获取用户的习惯,所述用户的问题记录包括用户的提问记录和用户点击问题的记录;
根据用户的问题记录、用户的属性以及每种用户属性对应的习惯项出现的概率,计算用户的人群习惯,用户的属性包括年龄、性别、职业和教育水平;
根据用户的习惯和人群习惯构建用户的习惯向量,所述用户的习惯向量中包括多个习惯项;
根据习惯项建立习惯权重。
4.如权利要求1所述的模型的生成方法,其特征在于,所述得到更新模型之后还包括:
将当前用户的问题输入更新模型,得到关联问题集;
采用排序函数对关联问题集进行排序并得到初始的候选问题列表;
将初始的候选问题列表根据主题性、长度性、局部顺序性和真实性的要求进行筛选;
将筛选后的问题列表按照问题的重要性和质量从高到低的顺序进行再排序,选取前N条问题供用户选择,N为正整数。
5.如权利要求4所述的模型的生成方法,其特征在于,所述选取前N条问题供用户选择之后还包括:
若用户点击了问题列表中某个问题,所述更新模型则自动获取该问题,并作为输入到更新模型中,并输出至少一个新的问题,并推荐给用户。
6.一种用于问题推荐的模型的生成系统,所述系统用于实现如权利要求1-5任一项所述模型的生成方法,其特征在于,所述模型的生成系统包括:
用户数据模块,用于获取预设用户数据库中的用户日志信息,所述用户日志信息包括用户与服务方的会话信息,所述会话信息包括若干用户问题;
关联模块,用于对用户日志信息进行预处理,对经过预处理的用户日志信息利用二项集关联规则进行关联问题挖掘,得到关联问题集;
预测模块,用于将关联问题集输入预先训练的神经模型中,并输出关联问题集对应的预测分数;
更新模块,用于获取预测分数小于预设阈值的关联问题,将预测分数小于预设阈值的关联问题重新输入所述预先训练的神经模型进行训练,得到更新模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110482159.1/1.html,转载请声明来源钻瓜专利网。





