[发明专利]一种问题目标特征自动识别和抽取方法在审

专利信息
申请号: 201910192494.0 申请日: 2019-03-14
公开(公告)号: CN109992651A 公开(公告)日: 2019-07-09
发明(设计)人: 郝天永;谢文秀;瞿瑛瑛 申请(专利权)人: 广州智语信息科技有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F17/27
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 肖宇扬;付静
地址: 510631 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 依存关系 预设 目标特征 问题文本 自动识别 匹配 样本 抽取 目标词识别 匹配规则 筛选规则 生成规则 用户提问 分析 目标词 词汇 文本 筛选
【说明书】:

发明公开了一种问题目标特征自动识别和抽取方法。该方法包括:根据预设的生成规则生成至少一个依存关系链样本;根据预设的匹配规则,从所述至少一个依存关系样本,匹配所述待分析问题文本匹配的候选依存关系链;根据预设的筛选规则,从所述候选依存关系链中,筛选出所述待分析问题文本的问题目标词。本发明的效果在于,通过本发明提供的问题目标词识别方法,从待分析文本中识别出于用户提问意图相关词汇,从而能够更加精确地识别用户的意图。

技术领域

本发明实施例涉及计算机技术领域,特别是涉及一种问题目标特征自动识 别和抽取方法。

背景技术

目前,随着人工智能技术和大数据技术的发展,问答系统作为信息检索系 统的一种高级应用形式,普遍存在于专业服务、教育、生活等各个研究领域。 其中,对用户所提出问题的目标进行精准识别与分类对于问答系统准确识别用 户信息需求、过滤候选答案、提高用户对答案的满意度具有直接影响。

然而,现有问答系统提供的候选答案不够准确,分析其原因,主要是现有 问答系统通过筛选用户问题的主题词来进行问题主题识别和分类,而忽视了问 题目标识别和分类的重要性。而问题主题与问题目标的识别和分类并不相同, 问题主题侧重于描述问题内容的主要对象,而问题目标则侧重描述用户期望答 案的类型,故通通过筛选用户问题的主题词来进行问题主题识别和分类的问答 系统并不能针对用户提出问题的意图而给出精确的答案。

发明内容

本发明的目的旨在至少在一定程度上解决上述的技术问题之一。

为此,本发明的第一个目的在于提出一种问题目标特征自动识别和抽取方 法,该方法基于什么背景,能够从用户问题的文本信息中识别出反映用户意图 的问题目标特征词,进而根据问题目标特征词,从海量的数据中搜索与问题目 标特征有关的信息,从而为用户提供更加准确的、满意的答案。

本发明第一方面提供一种基于问题目标特征识别和抽取方法,其中,该方 法包括:

根据预设的生成规则生成至少一个依存关系链样本;

根据预设的匹配规则从所述至少一个依存关系样本匹配所述待分析问题文 本匹配的候选依存关系链;

根据预设的筛选规则从所述候选依存关系链中筛选出所述待分析问题文本 的问题目标词。

可选地,所述根据预设的生成规则生成至少一个依存关系链样本,包括:

标注出问题样本文本中的问题目标特征词汇及与所述问题目标特征词相关 的词汇,形成标注数据集;

标注出所述问题样本文本中的问题目标特征词汇的词性,形成词性样本集; 使用句法分析算法对所述标注数据集进行句法分析,生成至少一个句法依存关 系链样本;

使用语义依存算法对所述标注数据集进行语义分析,生成至少一个语义依 存关系样本。

可选地,所述根据预设的匹配规则从所述至少一个依存关系样本匹配所述 待分析问题文本匹配的候选依存关系链,包括:

按照预设频度值,从所述至少一个句法依存关系链样本中筛选出频度大于 所述预设频度值的句法依存关系链样本;

基于筛选出的所述句法依存关系链样本,生成所述待分析问题文本的主要 句法依存关系链样本集,所述主要句法依存关系链样本集包括至少一个主要句 法依存关系链样本;

对所述待分析问题文本进行句法分析,生成所述待分析问题文本的句法依 存关系链集,所述句法依存关系链集包括至少一个句法依存关系链;

将所述句法依存关系链集与所述主要句法依存关系链样本集进行比较,筛 选出至少一个共有的句法依存关系链;

基于所述至少一个共有的句法依存关系链,生成所述待分析问题文本的至 少一个候选句法依存关系链。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州智语信息科技有限公司,未经广州智语信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910192494.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top