[发明专利]一种基于政务问答系统的意图识别算法在审
| 申请号: | 202110515100.8 | 申请日: | 2021-05-12 |
| 公开(公告)号: | CN113420130A | 公开(公告)日: | 2021-09-21 |
| 发明(设计)人: | 梁晨阳;贾亚飞;吕强;段飞虎;顾君;张宏伟 | 申请(专利权)人: | 同方知网数字出版技术股份有限公司;同方知网(北京)技术有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/242 |
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
| 地址: | 100084 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 政务 问答 系统 意图 识别 算法 | ||
1.一种基于政务问答系统的意图识别算法,其特征在于,包括以下步骤:
步骤A源数据清洗,通过分领域对数据进行分类处理;
步骤B根据源数据结构构建智能词典;
步骤C对用户输入的query进行处理,分析query中的信息,根据用户输入的query信息判断用户想要查询字段或相关问题;
步骤D根据步骤C中分析结果得到的相关词,进行分领域查询智能词典;
步骤E分析查询结果,处理查询结果并返回。
2.如权利要求1所述的基于政务问答系统的意图识别算法,其特征在于,所述步骤A中需清洗的源数据包括特殊符号和不合格的数据,且在清洗源数据时,需将数据进行分类处理,包括:数据领域分类,字段指标名称分类以及字段值分类;所述字段指标分为普通字段名称和枚举值字段名称;字段值分为普通值和枚举值。
3.如权利要求1所述的基于政务问答系统的意图识别算法,其特征在于,所述步骤B具体包括:
根据分好的领域,构建领域词典;
根据领域词典中的词,把词和词之间的关系建立一个对应的表来存储;所述词和词之间的关系包括词的属性、词和词之间的上下位关系;
将词作为一个实体存在图数据库中,所属的领域和相关分值为词的属性值。
4.如权利要求1所述的基于政务问答系统的意图识别算法,其特征在于,所述步骤C具体包括:
将数据库中所有的词进行预处理;
对近义词以及相关词的处理包括把所有字段词和它们的相关词进行最小分词,然后把所有的最小词和他们可能出现在的词统一存在一个最小词库;
分析用户query,先采用最小分词,根据用户query中包含的所有的最小词,去数据库中查询到所有相关词来进行计算,如果一个词的最小词都出现在query中,则确定该词出现在query中。
5.如权利要求1所述的基于政务问答系统的意图识别算法,其特征在于,所述步骤D具体包括:
将检测出的相关词进行分领域词典查询;
通过分领域词典查询判断一个词为字段名或字段值;
通过在图数据库中查询字段名的相关属性,获得该词所属领域。
6.如权利要求1所述的基于政务问答系统的意图识别算法,其特征在于,所述步骤E具体包括:
通过查询结果,处理产生冲突的相关字段;
通过意图词的定义判断字段具体的限制条件;
每个字段返回一个各个领域的相关分数,通过计算所有字段返回的各个领域相关分数之和确定最终的领域分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同方知网数字出版技术股份有限公司;同方知网(北京)技术有限公司,未经同方知网数字出版技术股份有限公司;同方知网(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110515100.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种升降过滤食材的火锅锅具
- 下一篇:一种除铁彻底的云母片除铁装置





