[发明专利]基于字符串相似度算法的智能客服搜索方法与系统在审

专利信息
申请号: 201410171685.6 申请日: 2014-04-25
公开(公告)号: CN103914570A 公开(公告)日: 2014-07-09
发明(设计)人: 陆赞信 申请(专利权)人: 北京中讯爱乐科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州三环专利代理有限公司 44202 代理人: 郝传鑫
地址: 100062 北京市东城区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 字符串 相似 算法 智能 客服 搜索 方法 系统
【说明书】:

技术领域

发明涉及信息检索技术领域,尤其涉及一种基于字符串相似度算法的智能客服搜索方法。

背景技术

随着经济的发展,国内外正在往服务型社会转变,要求社会的主体以人为本,具备更好地服务他人的理念,“智能客服”正是基于这个理念产生的。智能客服终端可以7天×24小时无间断为用户提供服务,既减少了资源的投入,也满足了用户随时访问的需求,提高了便捷性。譬如,目前,通过“微信”公众平台、SMS(Short Message Service,短信服务)等平台,用户可以随时将数据请求发送到服务平台的智能客服端口,服务平台的智能客服终端则需要根据用户请求的关键字,找到最匹配的信息(如问题答案)回复给用户。例如,用户在“微信”公众平台关注了某航空公司的公众账号后,发送信息“行程单”到该公众平台,智能客服终端可以检测出该信息,并在其所在的数据库中搜索出与该信息相关的行程内容,并进一步将这些内容推荐给用户,以满足用户获取某种特定数据的需要,智能地将用户请求与数据库数据进行匹配和推送。

目前的智能客服匹配大多是采用数据库技术,即在数据库中查找出用户请求搜索的提问语完全一致的关键词,或者将在提问语中出现的某个或某些关键词进行匹配。但是,这种简单的数据搜索方案无法做到“提问语与关键词中有某一部分相同”时的数据搜索和匹配计算,并且其无法智能更新数据库,因此难以做到真正的最优匹配。基于此,现有技术中提出了一些大数据量的数据匹配或搜索方案,虽然这种改进方案能够提高数据匹配搜索的准确度,但是这种数据量巨大的数据搜索方案无疑需要投入大量的时间和资源才能完成,因而其适用范围受到了限制。

发明内容

本发明所要解决的技术问题是,提供一种基于字符串相似度算法的智能客服搜索方法,如何降低数据搜索的复杂度并提高数据匹配的准确度,从而提高智能客服的整体性能和拓宽其适用范围。

为解决以上技术问题,一方面,本发明提供一种基于字符串相似度算法的智能客服搜索方法,

在知识库或陌生词库对关键词进行搜索,所述方法包括以下步骤:

S1:接收来自于客户端的搜索请求,在所述知识库中进行搜索;

S2:判断所述知识库中是否存在与所述搜索请求相匹配的关键词,若存在,则将所述知识库中相匹配的关键词所对应的回复语反馈至所述客户端;若不存在,则执行步骤S3,具体包括:

S21:将所述知识库中的所有关键词分割成多个数组;

S22:将每个数组中的所有关键词与所述搜索请求的提问语进行逐一比较,采用字符串相似度算法逐一计算出所述提问语与每个所述数组中所有关键词的相似度值;

S23:逐一比较所述相似度值与门限值的大小,记录大于所述门限值的相似度值;在大于所述门限值的相似度值中查找每个所述数组中的最大相似度值,并记录所述最大相似度值在所述知识库中所对应的标识以及所述最大相似度值的个数;

S24:判断所述最大相似度值是否存在最优值;若存在,则判定所述最优值的标识所对应的关键词为与所述搜索请求相匹配的关键词,且将所述相匹配的关键词在所述知识库中所对应的回复语判定为最优回复语并将其反馈至所述客户端;若不存在,则执行步骤S3;

S3:对所述陌生词库进行搜索;判断所述陌生词库中是否存在与所述搜索请求相匹配的关键词,若存在,则将所述关键词所对应的提问次数进行累计,并将默认回复语反馈至所述客户端;若不存在,则在所述陌生词库中新增与所述搜索请求相匹配的关键词,并将默认回复语反馈至所述客户端。

优选地,所述步骤S24具体包括:

若当前最大相似度值的个数为零时,判定所述最大相似度值中不存在最优值,并执行所述步骤S3;

若当前最大相似度值的个数不为零时,判定所述最大相似度值存在最优值,且检测所述知识库中是否存储有在先搜索的最优值;

若所述知识库中存储有在先搜索的最优值,则将所述在先搜索的最优值与当前最大相似度值进行比较,若不相等,则将所述在先搜索的最优值与所述当前最大相似度值中的较大值赋为当前搜索的最优值,并记录所述最优值的标识;若相等,则将所述在先搜索的最优值的个数与当前最大相似度值的个数进行比较;

若所述在先搜索的最优值的个数大于当前最大相似度值的个数,则将所述在先搜索的最优值赋为当前搜索的最优值,并记录所述最优值的标识;若所述在先搜索的最优值的个数小于当前最大相似度值的个数,则将所述当前最大相似度值赋为当前搜索的最优值,并记录所述最优值的标识;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中讯爱乐科技有限公司,未经北京中讯爱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410171685.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top