[发明专利]知识库的构建方法及装置在审
申请号: | 201611071770.0 | 申请日: | 2016-11-28 |
公开(公告)号: | CN108121722A | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 吕骋;王谦;吴瑞红;张翔;刘辉;刘海铭 | 申请(专利权)人: | 渡鸦科技(北京)有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06N5/02 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识库 用户意图 构建 规则知识库 应用接口 保存 词语 语义 参数传递 应用 分类 服务 | ||
本发明提供了一种知识库的构建方法及装置,其中,该方法包括:获取多个词;将多个词进行分类并分别保存在基础词典知识库中对应的词典中,其中,基础词典知识库包括多个用于保存不同类型词语的词典;根据意图规则知识库识别意图类别知识库中的用户意图,其中,意图规则知识库保存有识别用户意图的规则,意图类别知识库中保存有多个用户意图,用户意图是根据规则对基础词典知识库中的预定词语进行语义组合得到;根据每个用户意图对应的应用和/或服务构建应用接口知识库,其中,应用接口知识库中保存有用户意图对应的应用和/或服务的参数传递规则,解决了相关技术中现有知识库的构建合理度低的问题,提高了现有知识库的构建合理度。
技术领域
本发明涉及互联网领域,具体而言,涉及一种知识库的构建方法及装置。
背景技术
随着互联网的发展,互联网中信息在急剧增长,现有互联网上具有海量的知识,数据量巨大,数据结构复杂,组织无序,不利于后续的应用或者使用,目前,对于领域知识库的构建多采用自动或半自动知识抽取方法,如:通过定制爬虫对百科类站点、垂直网站进行抓取,获取网页(WEB)详情页面的对象属性、表格等半结构化信息来构建领域知识库。
但是,这类通过抽取WEB详情页面的数据信息构建起来的领域知识库,只能对抓取的词汇进行简单的分类,在海量且无序的知识中无法更深层的区分抓取到的词汇表达的更具体的用户的需求,并且在现有的知识库中查询数据时,由于其结构并不合理,就导致了查询时需要花费更多的时间,时延较大。在利用现有的知识库为用户提供服务时,无法更加智能地识别出用户的真正意图以及无法及时对用户的指示进行响应,使得用户体验度降低。为了确保计算机应用可以与时俱进地理解并智能处理目标事物,构建和使用一个结构合理、内容丰富、语义准确且信息及时的知识库是非常有必要的。
针对相关技术中现有知识库的构建合理度低的问题,目前还没有有效地解决方案。
发明内容
本发明实施例提供了一种知识库的构建方法及装置,以至少解决相关技术中现有知识库的构建合理度低的问题。
根据本发明的一个实施例,提供了一种知识库的构建方法,包括:获取多个词;将所述多个词进行分类并分别保存在基础词典知识库中对应的词典中,其中,所述基础词典知识库包括多个用于保存不同类型词语的词典;根据意图规则知识库识别意图类别知识库中的用户意图,其中,所述意图规则知识库保存有识别用户意图的规则,所述意图类别知识库中保存有多个用户意图,所述用户意图是根据所述规则对所述基础词典知识库中的预定词语进行语义组合得到;根据每个用户意图对应的应用和/或服务构建应用接口知识库,其中,所述应用接口知识库中保存有用户意图对应的应用和/或服务的参数传递规则。
可选地,所述基础词典知识库保存的词典包括以下至少之一:名词词典、动词词典、量词词典、版本词典,其中,所述版本词典用于指示所述名词词典中的名词对应的版本。
可选地,获取所述多个词包括:通过预先配置的渠道从网络上公开的内容中抓取信息和预设信息;对抓取到的信息进行分词处理得到所述多个词。
可选地,对所述信息进行分词处理得到所述多个词之后,所述方法还包括:对分词得到的词语进行标注,其中,所述标注用于指示以下至少之一:所述词语的来源、所述词语的类型。
可选地,在对分词得到的词语进行标注之后,所述方法还包括:根据所述词语的类型在基础词典知识库中对应的词典中获取与所述词语类型相同的词语;计算所述词语与所述类型相同的词语的相关度,其中,所述相关度用于指示所述词语与所述类型相同的词语的的相似程度;将所述相关度高于预设值的所述词语与所述类型相同的词语标记为同义词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渡鸦科技(北京)有限责任公司,未经渡鸦科技(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611071770.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:意图识别方法及装置
- 下一篇:一种分布式商城架构系统