[发明专利]一种智能生成接待记录的方法、装置及终端设备有效
申请号: | 202110542721.5 | 申请日: | 2021-05-19 |
公开(公告)号: | CN112966116B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 周金明;符俊;陈贵龙 | 申请(专利权)人: | 南京视察者智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210014 江苏省南京市秦淮区永智*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 生成 接待 记录 方法 装置 终端设备 | ||
1.一种智能生成接待记录的方法,其特征在于,该方法包括如下步骤:
步骤1,根据历史接待记录训练语言模型,通过语言模型获取申请人问题描述的文本记录,得到申请人的初始问题描述;
获取业务场景历史接待记录作为训练样本,历史接待记录包括文本记录和语音记录,文本记录的训练样本记作X,语音记录的训练样本记作Y;
对训练样本进行扩充:对于历史接待记录中的每个文本记录x,采用标准普通话和/或各类方言读取文本记录内容,通过录音扩充对应语言类型的语音记录训练样本,且标注对应的普通话或方言类型,加入到样本Y中;对于历史接待记录中的每个语音记录y,根据语音描述得到文本记录,构造出对应的文本记录训练样本,加入到样本X中,并采用标准普通话和/或各类方言读取文本记录内容,通过录音扩充对应语言类型的语音记录训练样本,且标注对应的普通话或方言类型,加入到样本Y中;
对于语音记录的训练样本Y,每条记录都存在普通话和各方言的语音记录数据,从而基于seq2seq模型训练得到本业务场景下的普通话转换为各方言的模型M1(A1),和各方言转换为普通话的模型M2(A2),其中A1是指某普通话记录;A2是指某方言记录;
对于文本记录的训练样本X,由于X中每条记录在Y中也同样存在对应的普通话和各方言的语音记录数据,从而基于seq2seq模型训练得到本业务场景下的文本转化为语音的模型M3(B1),和语音转化为文本的模型M4(B2),其中B1指文本记录,B2是指普通话或某方言的语音记录;
对每条语音记录进行标注,标注标签为对应的方言或普通话,构建训练样本训练线性分类模型C,使得线性分类模型C能够根据语音记录识别出语言是普通话还是某方言;
根据训练好的模型M1、模型M2、模型M3、模型M4、模型C,在窗口接待场景中,将申请人的问题描述转换为文本记录,并从文本记录中提取出具体问题的问题描述作为初始问题描述;
步骤2,通过初始问题生成相关衍生问题,并向申请人进一步询问;
把获取的业务场景历史接待记录,根据训练好的模型M1、模型M2、模型M3、模型M4、模型C,得到对应的文本记录,进而得到问题文本,并对问题文本提取出若干个关键词;
构造问题衍生图G,具体为:以问题文本作为节点;对任意两个问题文本,若两个问题文本存在相同的关键词,则在这两个节点之间连接一条边,边的权重是相同关键词的个数;
从初始问题描述中提取出若干个关键词,根据衍生图G生成衍生问题集合H;
通过BERT文本匹配模型计算每个衍生问题与初始问题的相似度,将相似度高的k个衍生问题优先展示供工作人员参考,进一步询问申请人该k个衍生问题并获取申请人反馈进行登记记录;
步骤3,为申请人提供详细回答以及综合处理回答,形成接待记录;
对问题衍生图G中的每个节点所代表的问题,出现多个反馈,依据历史经验及法律、规章制度构造每个问题节点的处理树,多个反馈分别对应多个处理回答;
工作人员询问相似度高的k个衍生问题记为:Q1,Q2,Q3,…, Qk,其对应的申请人反馈记为P1,P2, P3,…, Pk,对于每个衍生问题Qi,i∈{1,2,3,……k},根据其对应的处理树和对应的申请人反馈Pi得到该衍生问题最合适的处理回答,记为Ri,从而得到k个详细处理回答R1,R2, R3,…, Rk,结合k个详细处理回答得到综合处理回答;把详细处理回答和综合处理回答一并作为接待记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京视察者智能科技有限公司,未经南京视察者智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110542721.5/1.html,转载请声明来源钻瓜专利网。