[发明专利]一种文本处理方法及智能客服方法在审
申请号: | 201810986605.0 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109461039A | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 邹辉;肖龙源;蔡振华;李稀敏;刘晓葳;谭玉坤 | 申请(专利权)人: | 厦门快商通信息技术有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/332;G06F17/27 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361007 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名实体 意图信息 文本 文本处理 客服 改写 网络通信技术 后续分析 智能 分类 | ||
1.一种文本处理方法,其特征在于,所述方法包含步骤:
分别对所述文本进行意图分类及命名实体识别,以获取所述文本所包含的意图信息及命名实体;
当所述识别结果中,包含所述意图信息及所述命名实体时,基于所述意图信息及所述命名实体对所述文本进行改写;
当所述识别结果中,仅包含所述意图信息或所述命名实体中的一种时,基于获取到的所述意图信息或所述命名实体对所述文本进行改写。
2.如权利要求1所述的文本处理方法,其特征在于,所述分别对所述文本进行意图分类及命名实体识别的方法具体包含:
基于预设意图分类模型对所述文本所包含的意图信息进行识别;
基于预设命名实体识别模型对所述文本所包含的命名实体进行识别。
3.如权利要求2所述的文本处理方法,其特征在于,所述预设意图分类模型的训练方法包含步骤:
收集原始语料,构建语料库;
从所述语料库中抽取训练语料,并对所述训练语料进行意图信息标注;
计算所述训练语料的句向量;
基于所述训练语料对所述预设意图分类模型进行训练。
4.如权利要求3所述的文本处理方法,其特征在于,所述训练语料为对话轮数超过预设阈值的对话记录中的问句。
5.如权利要求3所述的文本处理方法,其特征在于,所述计算所述训练语料的句向量的方法具体包含:
对所述语料库中的所有语料进行分词,并学习每个所述分词的词向量;
对所述训练语料进行分词,并基于上一步获得的所述语料库中所有分词的词向量,确定所述训练语料中分词的词向量;
将所述训练语料中每一个所述分词的词向量叠加求平均值,得到所述训练语料的句向量。
6.如权利要求1所述的文本处理方法,其特征在于,所述当所述识别结果中,包含所述意图信息及所述命名实体时,基于所述意图信息及所述命名实体对所述文本进行改写具体包含:
拼接所述意图信息及所述命名实体。
7.如权利要求1所述的文本处理方法,其特征在于,所述当所述识别结果中,仅包含所述意图信息或所述命名实体中的一种时,基于获取到的所述意图信息或所述命名实体对所述文本进行改写具体包含:
将所述意图信息或所述命名实体与所述文本进行拼接。
8.如权利要求1所述的文本处理方法,其特征在于,当无法识别出所述文本所包含的所述意图信息或所述命名实体时,对所述文本的上下文数据进行所述意图分类或所述命名实体识别,并以所述上下文数据中所包含的所述意图信息或所述命名实体作为所述文本的所述意图信息或所述命名实体。
9.一种智能客服方法,其特征在于,所述方法包含:
接收用户输入的文本数据;
基于权利要求1至8中任一项所述的文本处理方法对所述文本数据进行处理;
基于处理后的所述文本数据,查询预设问答数据库,获取所述文本数据对应的答案信息;
输出所述答案信息给所述用户。
10.如权利要求9所述的智能客服方法,其特征在于,所述预设问答数据库的构建方法包含步骤:
收集历史客服对话数据;
从所述对话数据中提取对话轮数超过预设阈值的对话记录;
基于权利要求1至8中任一项所述的文本处理方法对所述对话记录中的问句进行处理;
保存处理后的所述问句及所述问句在所述对话记录中对应的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息技术有限公司,未经厦门快商通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810986605.0/1.html,转载请声明来源钻瓜专利网。