[发明专利]一种基于知识图谱的智能问答方法在审
申请号: | 202211707259.0 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116089581A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 杨文;封晨;王鹏飞;孙冠群;王通宇;吕晓钢;李一帆;杨琳;武欣桐;纪腾飞 | 申请(专利权)人: | 天津光电通信技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/33;G06F40/295;G06N5/02;G06N3/045;G06N3/044;G06N3/0464;G06N3/08 |
代理公司: | 天津中环专利商标代理有限公司 12105 | 代理人: | 杨舒文 |
地址: | 300210*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 智能 问答 方法 | ||
本发明涉及一种基于知识图谱的智能问答方法,包括:对应用领域知识图谱的实体、属性、关系进行预先设计;采集数据并对采集到的数据按照预先设计的知识图谱结构进行标注;从数据中抽取实体、关系、属性,经人工检查存储到Neo4j数据库中构建得到知识图谱;对输入的问句按照意图进行分类;对专业意图的问句进行实体识别和意图推理;根据实体识别和意图推理的结果匹配模板,生成CQL语句;最终将CQL语句在数据库中的查询结果生成文本,得到最终问答结果。实现了对自然语言问句的理解,并针对问句做出相对准确的回答。
技术领域
本发明涉及知识图谱领域,具体涉及一种基于知识图谱的智能问答方法。
背景技术
知识图谱本质上是一个庞大的知识库,以图的结构形式将知识库内的知识进行链接,用可视化技术描述知识资源及其载体,可以形象地挖掘、分析、构建和显示知识及其联系。问答系统是信息检索系统的一种高级形式,他能用准确、简洁的自然语言回答用户用自然语言提出的问题。近年来,基于知识图谱的问答系统成为学术界和工业界研究和应用的热点,在百科知识问答、金融、医疗等领域得到了广泛的应用。
现有技术中,构建的知识图谱模型多为通用知识图谱,覆盖面广泛,但质量差,容易出现数据松散和覆盖率低的问题,导致问答过程对于专业知识匹配覆盖较低,很多时候得不到满意的回答。同时针对智能问答方法,现有技术经常采用将意图识别视为分类任务,该方法虽然有效,但如果问题中混杂普通对话和专业意图,分类准确率不够理想。
因此,如何构建专业领域知识图谱,并基于知识图谱准确进行用户意图识别,实现专业领域的智能问答,成为本领域技术人员亟待解决的问题。
发明内容
鉴于现有技术的状况,本发明提供了一种基于知识图谱的智能问答方法,对应用领域知识图谱的实体、属性、关系进行预先设计;采集数据并对采集到的数据按照预先设计的知识图谱结构进行标注;从数据中抽取实体、关系、属性,经人工检查存储到Neo4j数据库中构建得到知识图谱;对输入的问句按照意图进行分类;对专业意图的问句进行实体识别和意图推理;根据实体识别和意图推理的结果匹配模板,生成CQL语句;最终将CQL语句在数据库中的查询结果生成文本,得到最终问答结果,实现了应用领域的智能问答,提高了问答的准确率。
本发明采取的技术方案是:一种基于知识图谱的智能问答方法,该方法包括知识图谱构建、文本预处理、问题匹配、文本生成:
步骤1,所述的知识图谱构建,首先借助专家知识,对专业领域知识图谱的实体、属性、关系进行预先设计;其次通过采用开源数据或爬虫方式采集数据,包括结构化数据、半结构化数据和非结构化数据,并对采集到的数据按照预先设计的知识图谱结构进行标注;最终进行知识抽取,以标注结果为标签,从数据中抽取其中包含的实体、关系、属性,并将抽取结果进行人工检查,确保无误后将其以实体-关系-实体和实体-属性-属性值的三元组形式存储到Neo4j数据库中,视为知识图谱构建完成;
步骤2,所述的文本预处理,是指对用户输入的查询语句进行处理,首先进行意图诊断,判断是闲聊意图还是专业问题,若为闲聊问题,采用预设好的模板进行回答;若为专业问题,则由命名实体识别模型提取出问句中包含的专业实体,再由意图推理模型,推断询问的是哪方面的专业意图并得出意图置信度;
步骤3,所述的问题匹配,首先通过专业实体和专业意图选择模板,再通过槽位填充的方式进行处理,根据步骤2意图推理得到的意图置信度确定回复策略并生成对应的CQL查询语句到Neo4j数据库中查询内容;
步骤4,所述的文本生成,将查询结果输入到文本生成模型中,得到自然语言形式的句子,并将其作为最终答案。
步骤1中所述的知识抽取,采用实体关系联合抽取方法,以标注结果为标签,同时抽取出数据中包含的实体、关系和属性。
步骤2中所述的命名实体识别模型,采取bert预训练模型+BiLSTM+CRF的网络结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津光电通信技术有限公司,未经天津光电通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211707259.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种石英砂动态连续酸洗提纯工艺方法及装备
- 下一篇:无线供电工作台