[发明专利]一种智能客服语义处理方法有效
| 申请号: | 202010284743.1 | 申请日: | 2020-04-13 |
| 公开(公告)号: | CN111523328B | 公开(公告)日: | 2023-09-05 |
| 发明(设计)人: | 费春勇;黄峰;余敏;王定军;张继康 | 申请(专利权)人: | 中博信息技术研究院有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F40/289;G06F40/242;G06N3/02;G06F16/332;G06Q30/015 |
| 代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 李珍 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 智能 客服 语义 处理 方法 | ||
1.一种智能客服语义处理方法,其特征在于:包括如下步骤:
步骤1:建立客服客户端、样本数据采样模块和云服务器,客服客户端、样本数据采样数据库和云服务器之间通过互联网相互通信;
在云服务器中建立DSSM语义相似度模型模块和TF-IDF模型模块;
在样本数据采样模块中建立领域外开源样本数据库和领域内样本数据库;
步骤2:在DSSM语义相似度模型模块中建立DSSM语义相似度模型;
DSSM语义相似度模型模块调取领域外开源样本数据库中的数据对DSSM语义相似度模型进行训练;
步骤3:对领域内样本数据库中的数据进行标注处理,其标注方法采用问题+答案的方式;
步骤4:在样本数据采样模块中添加开放领域知识丰富训练数据库;
步骤5:根据开放领域知识丰富训练数据库中的数据,建立领域专用字典;
步骤6:基于word2vec将专用字典中的所有字均生成对应的字向量T;
步骤7:根据以下方法以DSSM为算法核心,选定Transformer特征提取网络,对标注好的数据进行训练,得到DSSM语义相似度模型:
步骤S1:以Transformer-DSSM深度网络为主要框架,输入字向量T经过双向GRU提取特征后输出256维向量;
步骤S2:将步骤S1的结果再输入到Transformer层,经提取特征后输出512维向量F=((t11,t12,t13,...t1,512),...(tc1,tc2,tc3,...,tc,512));其中,c代表知识库文本的数量;
步骤S3:设定问题向量为Fq,答案向量为Fa,计算问题向量Fq与答案向量Fa之间的余弦距离:R(q,a)=cosine(Fq,Fa);
步骤S4:通过softmax函数将余弦距离R(q,a)转化为一个后验概率:
其中γ为softmax的平滑因子,a+为答案中的正样本,a-为随机负采样的负样本,a为整个答案下的样本空间;
步骤S5:通过极大似然估计,最小化损失函数进行训练,得到相似度模型M;
步骤8:将开放领域知识丰富训练数据库和领域内样本数据库中的数据作为训练数据,对训练数据进行文本的分词和去除停用词的处理,基于gensim模块训练TF-IDF模型,得到模型矩阵,根据模型矩阵计算相似度。
2.如权利要求1所述的一种智能客服语义处理方法,其特征在于:所述开放领域知识丰富训练数据库包括日常聊天和百度百科。
3.如权利要求1所述的一种智能客服语义处理方法,其特征在于:在执行步骤6时,在字向量模型中,参与对DSSM语义相似度模型进行训练的数据T表示为:T=((t11,t12,t13,...t1l),...(tc1,tc2,tc3,...,tcl)),其中l代表词向量的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中博信息技术研究院有限公司,未经中博信息技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010284743.1/1.html,转载请声明来源钻瓜专利网。





