[发明专利]用于基于标准问创建扩展问的方法和装置有效
| 申请号: | 201510438526.2 | 申请日: | 2015-07-23 |
| 公开(公告)号: | CN104991965B | 公开(公告)日: | 2018-11-23 |
| 发明(设计)人: | 蔡宏伟;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司;贵州小爱机器人科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 徐伟 |
| 地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 基于 标准 创建 扩展 方法 装置 | ||
本发明提供了一种用于基于标准问创建扩展问的方法,标准问和扩展问用于人工智能语义识别系统中,包括:基于该标准问所属的数据范围从该人工智能语义识别系统的内部数据源或外部数据源采集数据;以所采集数据为对象执行与该标准问的问句相似度计算以获得相似问句集;以及对该相似问句集执行主语修改以获得该标准问的扩展问。
技术领域
本发明涉及知识库的编辑与扩展,尤其涉及用于人工智能语义识别的标准问的扩展。
背景技术
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。
为了能够理解人类语言,人工智能语义识别系统需要一套知识库。海量异构数据通过知识学习体系整理成知识,并融入到已有的知识体系中来。不同企业会生成各自的“专属知识”;同领域企业的知识中可以总结出“领域语义库”,如图中的“电信领域语义库”;多个行业的知识还可以总结成“通用语义库和知识库”。
知识库的编辑与扩展对于人工智能语义识别系统尤其重要。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
根据本发明的一方面,提供了一种用于基于标准问创建扩展问的方法,标准问和扩展问用于人工智能语义识别系统中,包括:
基于该标准问所属的数据范围从该人工智能语义识别系统的内部数据源或外部数据源采集数据;
以所采集数据为对象执行与该标准问的问句相似度计算以获得相似问句集;以及
对该相似问句集执行主语修改以获得该标准问的扩展问。
在一实例中,该基于该标准问所属的数据范围从内部数据源或外部数据源采集数据包括:若该标准问属于内部数据,则从该内部数据源调用所有内部数据,以及若该标准问属于外部数据,则通过该外部数据源进行搜索爬取。
在一实例中,该方法还包括对通过该外部数据源爬取到的所采集数据进行整理以过滤无用数据,该执行问句相似度计算是以整理后的所采集数据为对象来执行的。
在一实例中,若该标准问所属领域的词库在该人工智能语义识别系统的知识库中已存在,则所属标准问为内部数据,否则为外部数据。
在一实例中,该内部数据源为该人工智能语义识别系统的知识库中已存在的关于该标准问的所属领域的词库,以及该外部数据源包括与该标准问的所属领域相关的第三方数据库。
在一实例中,该问句相似度计算是基于文本聚类分析、LDA分析、或序列分析中的任一者来执行的。
在一实例中,该相似问句集是与该标准问的相似度超过预定阈值的问句的集合。
在一实例中,该方法还包括至少部分地基于人工选择对该相似问句集执行筛选以过滤无用数据,该问句主语修改是对调整后的该相似问句集来执行的。
在一实例中,对该相似问句集执行主语修改是至少部分地基于人工选择来执行的。
根据本发明的另一方面,提供了一种用于基于标准问创建扩展问的装置,标准问和扩展问用于人工智能语义识别系统中,包括:
数据采集单元,用于基于标准问所属的数据范围从该人工智能语义识别系统的内部数据源或外部数据源采集数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司;贵州小爱机器人科技有限公司,未经上海智臻智能网络科技股份有限公司;贵州小爱机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510438526.2/2.html,转载请声明来源钻瓜专利网。





