[发明专利]问答数据处理方法及装置有效
申请号: | 201710247233.5 | 申请日: | 2017-04-14 |
公开(公告)号: | CN107193872B | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 卢道和;陈刚;周杰;陈朝亮;杨海军 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 数据处理 方法 装置 | ||
1.一种问答数据处理方法,其特征在于,所述问答数据处理方法包括:
从知识库中提取出长度大于预设字节的问题;
对提取的各个问题进行去停用词处理;
对处理后的各个问题进行分词,并将分词后的各个问题与预设的无意义词进行比对,以筛选出与无意义词的相似度小于预设相似度的问题;
将筛选出的各个问题作为待进行相似度匹配的各个问题;
将知识库中提取出的各个问题进行相似度匹配,以将相似度大于预设阈值的问题归为一类,并累计每一类问题的数量;
提取出数量排在前面预设位数的各类问题;
将提取的各类问题到知识库中进行查询,以得到从知识库中返回的各类问题的答案;
将各类问题以及从知识库中返回的答案展示在显示界面中;
其中,所述将知识库中提取出的各个问题进行相似度匹配,以将相似度大于预设阈值的问题归为一类的步骤包括:按照预设顺序,将知识库中提取出的每个问题与其它问题进行分词比对;
在检测到有问题与其它问题的相似度达到所述预设阈值时,将所述问题与所述其它问题归为一类,并将所述问题与所述其它问题打上标记信息;
将剩余未归类的每个问题依次与其它未归类的问题进行相似度的比对,以实现各个问题的归类,其中,打上标记信息的问题不与所述其它未归类的问题进行相似度的比对。
2.如权利要求1所述的问答数据处理方法,其特征在于,所述将提取的各类问题到知识库中进行查询,以得到从知识库中返回的各类问题的答案的步骤之后,所述问答数据处理方法还包括:
将知识库返回的各类问题的答案与服务器数据库中对应的各类问题的预存答案进行分析比较,以确定知识库返回的各类问题的答案是否与对应的预存答案达到预设匹配度;
若有问题的答案与对应的预存答案未达到预设匹配度,则将知识库返回的答案转至人工处理,由人工进行核对、纠偏和标注。
3.如权利要求2所述的问答数据处理方法,其特征在于,所述若有问题的答案与对应的预存答案未达到预设匹配度,则将知识库返回的答案转至人工处理,由人工进行核对、纠偏和标注的步骤之后,所述问答数据处理方法还包括:
若接收到人工基于所述问题进行核对、纠偏和标注后的答案,根据所述答案更新所述问题的预设答案以及所述知识库。
4.一种问答数据处理装置,其特征在于,所述问答数据处理装置包括:
提取模块,用于从知识库中提取出长度大于预设字节的问题;
处理模块,用于对提取的各个问题进行去停用词处理;
分词筛选模块,用于对处理后的各个问题进行分词,并将分词后的各个问题与预设的无意义词进行比对,以筛选出与无意义词的相似度小于预设相似度的问题;
所述处理模块,用于将筛选出的各个问题作为待进行相似度匹配的各个问题;
所述处理模块,用于将知识库中提取出的各个问题进行相似度匹配,以将相似度大于预设阈值的问题归为一类,并累计每一类问题的数量;
所述提取模块,用于提取出数量排在前面预设位数的各类问题;
匹配模块,用于将提取的各类问题到知识库中进行查询,以得到从知识库中返回的各类问题的答案;
展示模块,用于将各类问题以及从知识库中返回的答案展示在显示界面中;
其中,所述处理模块包括:
比对单元,用于按照预设顺序,将知识库中提取出的每个问题与其它问题进行分词比对;
处理单元,用于在检测到有问题与其它问题的相似度达到所述预设阈值时,将所述问题与所述其它问题归为一类,并将所述问题与所述其它问题打上标记信息;
归类单元,用于将剩余未归类的每个问题依次与其它未归类的问题进行相似度的比对,以实现各个问题的归类。
5.如权利要求4所述的问答数据处理装置,其特征在于,所述问答数据处理装置还包括:
确定模块,用于将知识库返回的各类问题的答案与服务器数据库中对应的各类问题的预存答案进行分析比较,以确定知识库返回的各类问题的答案是否与对应的预存答案达到预设匹配度;
转接模块,用于若有问题的答案与对应的预存答案未达到预设匹配度,则将知识库返回的答案转至人工处理,由人工进行核对、纠偏和标注。
6.如权利要求5所述的问答数据处理装置,其特征在于,所述问答数据处理装置还包括:
更新模块,用于若接收到人工基于所述问题进行核对、纠偏和标注后的答案,根据所述答案更新所述问题的预设答案以及所述知识库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710247233.5/1.html,转载请声明来源钻瓜专利网。