[发明专利]一种知识库的构建方法和装置在审
申请号: | 201610902538.0 | 申请日: | 2016-10-17 |
公开(公告)号: | CN107958004A | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 段福高;冯俊兰;邓路;胡珉;王燕蒙 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司11243 | 代理人: | 许静,安利霞 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识库 构建 方法 装置 | ||
技术领域
本发明涉及通信技术领域,特别是指一种知识库的构建方法和装置。
背景技术
在客服领域,知识库已经成为客服部门日常应答客户问题的知识来源。知识库是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。
(1)知识采编方面
在客服领域,存在着海量的以非结构化文档形式存储的知识,目前的知识采编过程还是以人工录入为主,效率低下。特别是要实现知识点的分割细化,就更加需要机器来自动完成而减少人工干预,进而才会提高知识的采编效率。
(2)知识存储方面
传统的文档式知识库采用大篇幅式存储,在知识维护、共享与扩展等方面都存在一些较为突出的问题,造成了工作效率的降低,已经被数据库管理系统所替代。
而基于数据库管理系统的知识库,目前的存储形式分为两种,即基于关系型数据库和非关系型数据库,其优势在于知识的生产、审核与知识使用不会被割裂开来,同时提高了工作效率。
在客服领域,针对某项业务下的知识点往往是由QA(问题-答案)和非QA组成,特别是非QA内容,又会包含图表等复杂内容,而现有的知识库往往对知识点内容进行整体性存储,并没有对其进行细粒度的分割,进而导致提供给客户的不是最精确的答案。
(3)知识共享方面
在客服领域,由于地域性的差异,各个地域客服部门会维护一套自己的知识库,很多共性的知识都是在进行重复性的存储。
(4)知识获取方面
大部分情况是客户写入关键词、自动关联一篇或几篇知识文档推送给客户,而这些知识文档之前是服务于座席培训、阅读后用来回答客户问题的,但现在直接开放给客户。由于这些文档没做客户化的工作或者做的不够,存在着专业术语多、逻辑不清晰、官方立场而非客户立场等问题,用户看不懂或者与用户问题关联度较差,虽然能够解决一部分问题但满意度不高。
另一部分做的比较好的是客户通过类似于聊天的自然语言与系统互动,系统建立了相应的词库进行分词,提取出相应的关键词后再进行搜索,回复给客户的是碎片化的片段内容。这种系统背后的核心仍然是搜索,只是将相应内容作了一定程度的碎片化并手动设置了相应的标签,客户体验好于前面的一种情况,但也只能在客户输入的语言比较专业时效果才好,而问题是大部分客户根本不专业。
发明人实现本发明的过程中,发现现有技术存在如下缺点:
1),知识结构优化问题。在实际的知识存储过程中,传统的知识存储方法在知识的共享、融合过程中存在先天性的缺陷。
知识共享方面,目前各个地域城市会根据业务分类对知识点的共性知识进行重复性存储。比如“国际业务”下的-“国际长途”知识点,对于“取消国际长途”问题,有两条答案,其中共性的答案是“10086热线取消”,非共性的答案是“访问某城市移动网上营业厅取消”。共性知识的重复性存储严重影响了知识的唯一性和无二义性,在知识的扩充和更改方面也会增加难度和成本。
知识融合方面,知识的粒度细分程度决定了知识的融合难易程度。目前客服领域知识的粒度不一,有的是粗粒度(如文档),有的是细粒度(如常见问题知识(FAQ))。很多知识库仅仅针对FAQ实现了细粒度划分,而针对某业务描述性的文档(带有图片、表格等)都是进行粗粒度的存储,如业务-知识点或业务-知识点-摘要的形式,粒度的细分程度不够,客户最终得到也不是精准的知识。
2),知识的语义关联问题。目前对知识的关联主要还是在搜索层面上实现的,比如建立了“Family”与“家庭”的关联(同义词),那么无论是用“家庭套餐”还是用“Family套餐”去发现,都可以找到知识库中的“家庭套餐”。但是客户的问题是多样的,如果要给出准确或接近客户意图的知识,单纯在搜索层面上建立词-词关联,给出的仍然是孤立的知识点。如果能够从知识点本身出发,建立知识点与知识点之间的关联,用户会得到更多接近其搜索意图的知识。
3),知识自动分割录入问题。目前,知识的生产人员多是通过知识库管理系统界面进行人工知识分割和录入。知识生产人员面临着在不同功能操作之间的反复切换,系统的延迟性与不稳定性都在制约着知识的录入效率。
发明内容
本发明提供了一种知识库的构建方法和装置,通过对知识点进行分解,以知识块集合的形式进行细粒度存储,降低了知识在融合和共享方面的复杂性,在知识搜索方面也可以实现精确的知识反馈,满足用户对不同颗粒度的知识快速获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团公司,未经中国移动通信有限公司研究院;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610902538.0/2.html,转载请声明来源钻瓜专利网。