[发明专利]催收优化方法及设备在审
| 申请号: | 202110905558.4 | 申请日: | 2021-08-09 |
| 公开(公告)号: | CN113362169A | 公开(公告)日: | 2021-09-07 |
| 发明(设计)人: | 刘国全;周大志;孟慧智;张宏;易奇志 | 申请(专利权)人: | 上海慧捷智能技术有限公司;慧捷(上海)科技股份有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N3/08;G06N3/04;G10L15/16;G10L15/06 |
| 代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 甘章乖;邵栋 |
| 地址: | 201210 上海市浦东新区中*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 催收 优化 方法 设备 | ||
1.一种催收优化方法,其特征在于,所述方法包括:
获取催收对象的通话语音数据;
将所述通话语音数据根据词频词典进行向量化处理,获取所述通话语音数据的词频特征,所述词频特征与所述通话语音数据中的词语在所述词频词典对应的离线语音数据样本中出现的词频相关;
将所述词频特征作为输入信息,输入第一深度神经网络,获取所述催收对象的第一特征信息,所述第一特征信息用于表示所述催收对象的特征标签;
获取催收对象的第二特征信息,并将第一特征信息和第二特征信息组合为第三特征信息,所述第二特征信息基于所述催收对象的个人信息确定;
将所述第三特征信息输入第二深度神经网络,获取所述催收对象的催收策略信息。
2.根据权利要求1所述的方法,其特征在于,将所述通话语音数据根据词频词典进行向量化处理,获取所述通话语音数据的词频特征,包括:
将所述通话语音数据进行分词处理,获取组成所述通话语音数据的多个词语;
从词频词典查找所述词语的词频排序序号;
根据所述词语对应的词频排序序号,确定所述通话语音数据对应的数字序列;
将所述数字序列对应的向量确定为所述通话语音数据的词频特征。
3.根据权利要求2所述的方法,其特征在于,根据所述词语对应的词频排序序号,确定所述通话语音数据对应的数字序列,包括:
若所述词语的数量少于词频特征的维度值,将词语的顺序将对应的词频排序序号以及K个填充值组合为所述通话语音数据对应的数字序列,其中,K为所述词频特征的维度值与所述词语的数量之间的差值;
若所述词语的数量多于词频特征的维度值,选取前M个词语所对应的词频排序序号,确定为所述通话语音数据对应的数字序列,其中,所述M为所述词频特征的维度值。
4.根据权利要求1所述的方法,其特征在于,该方法还包括采用如下方式获取词频词典:
获取离线语音数据样本,所述离线语音数据样本包括多条通话语音数据;
统计所述离线语音数据样本中所包含的词语的词频,并根据所述词频进行排序,确定所述词语对应的词频排序序号;
获取包括词语以及对应词频排序序号的词频词典。
5.根据权利要求1所述的方法,其特征在于,该方法还包括采用如下方式训练获取第一深度神经网络:
获取离线语音数据样本,作为第一训练集数据,所述离线语音数据样本包括多条通话语音数据;
将所述离线语音数据样本中通话语音数据根据词频词典进行向量化处理,获取所述通话语音数据的词频特征;
标注所述离线语音数据样本中通话语音数据所对应的催收对象的第一特征信息;
以所述词频特征作为输入信息、所述第一特征信息作为输出信息,训练所述第一深度神经网络。
6.根据权利要求5所述的方法,其特征在于,所述第一特征信息采用独热编码的格式表示。
7.根据权利要求5所述的方法,其特征在于,所述第一深度神经网络中输出层的激活函数为Softmax函数,损失函数为交叉熵损失函数,隐藏层包括循环神经网络或长短时记忆神经网络。
8.根据权利要求1所述的方法,其特征在于,获取催收对象的第二特征信息,包括:
根据催收对象的个人信息,将所述个人信息转换为对应的数字序列;
将所述数字序列所对应的向量确定为第二特征信息。
9.根据权利要求1所述的方法,其特征在于,所述催收策略信息包括谈判策略、施压点和/或推荐坐席。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海慧捷智能技术有限公司;慧捷(上海)科技股份有限公司,未经上海慧捷智能技术有限公司;慧捷(上海)科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110905558.4/1.html,转载请声明来源钻瓜专利网。





