[发明专利]模型的生成方法、系统、计算机设备和存储介质有效
申请号: | 202110482159.1 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113064986B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 任小芹 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F16/903;G06N3/04;G06N3/08 |
代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 张曾明 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 生成 方法 系统 计算机 设备 存储 介质 | ||
本发明提供了一种用于问题推荐的模型的生成方法、系统、计算机设备和存储介质,其中,模型的生成方法包括获取预设用户数据库中的用户日志信息,用户日志信息包括用户与服务方的会话信息,会话信息包括若干用户问题;对用户日志信息进行预处理,对经过预处理的用户日志信息利用二项集关联规则进行关联问题挖掘,得到关联问题集;将关联问题集输入预训练的神经模型中,并输出关联问题集对应的预测分数;获取预测分数小于预设阈值的关联问题,将预测分数小于预设阈值的关联问题重新输入所述神经模型进行训练,得到更新模型。因此,本发明可以在实现精准用户问题推荐的情况下,同时还方便数据的优化迭代。本发明还可以用于区块链技术领域。
技术领域
本发明涉及数据分析技术领域,特别是涉及模型的生成方法、系统、计算机设备和存储介质。
背景技术
智能客服机器人一个核心功能点是问答,即在用户提出问题的时候,提供相应的答案。而为了进一步提高问答过程中的用户体验,问答推荐应运而生,使得机器人在回答用户问题的同时,预测用户接下来可能会提问的问题,以此减少用户输入的工作以及构思如何提问的压力。
问答推荐的两个核心步骤是生成候选关联问,以及关联问匹配推荐。经调研,现在主流的候选关联问都是离线人工配置的,同时关联问的匹配推荐也基本上基于规则匹配。这样的流程使得推荐文本单一,且无法高效的进行优化迭代;且推荐的内容可能与用户实际需求不一致。
发明内容
基于此,本发明提供了一种用于问题推荐的模型的生成方法、系统、计算机设备和存储介质,在实现精准用户问题推荐的情况下,同时还方便数据的优化迭代。
为实现上述目的,本发明提供一种用于问题推荐的模型的生成方法,所述模型的生成方法包括:
获取预设用户数据库中的用户日志信息,所述用户日志信息包括用户与服务方的会话信息,所述会话信息包括若干用户问题;
对用户日志信息进行预处理,对经过预处理的用户日志信息利用二项集关联规则进行关联问题挖掘,得到关联问题集;
将关联问题集输入预先训练的神经模型中,并输出关联问题集对应的预测分数;
获取预测分数小于预设阈值的关联问题,将预测分数小于预设阈值的关联问题重新输入所述预先训练的神经模型进行训练,得到更新模型。
优选的,所述对经过预处理的用户日志信息利用二项集关联规则进行关联问题挖掘,得到关联问题集的步骤包括:
获取用户日志信息中的单通会话,并从该会话中任意选取两个用户问题组成一个二项集,判断该会话有几个用户问题,根据该会话的用户问题数量得到C(N,2)个二项集,N为所述会话中包含的N个用户问题,C为求组合数的符号;
重复操作,直至所有会话都形成二项集,将二项集汇总得到个二项集,并统计出现频率前预设比例的二项集作为关联二项集,其中,M为会话数,i为代表会话的编号;
对关联二项集进行结果清洗,得到关联问题集。
优选的,所述对关联二项集进行结果清洗,得到关联问题集的步骤包括:
对关联二项集进行内部去重;
采用规则匹配算法删除关联二项集的敏感信息,所述规则匹配算法为RETE算法,所述敏感信息包括电话号码和身份证号;
采用字符串编辑距离来判断关联二项集中的问题是否相关,当编辑距离大于预设阈值时,则删除编辑距离大于预设阈值的问题。
优选的,所述将关联问题集输入预先训练的神经模型中,并输出关联问题集对应的预测分数还包括:
在神经模型中根据用户提问的习惯建立习惯权重,所述神经模型为widedeep模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110482159.1/2.html,转载请声明来源钻瓜专利网。