[发明专利]基于中文命名实体识别的机器人语言指令分析方法及系统有效
申请号: | 202110236088.7 | 申请日: | 2021-03-03 |
公开(公告)号: | CN112883737B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 许庆阳;姜聪;周瑞;李贻斌;张承进;宋勇;袁宪锋;庞豹 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/253;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 264209 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 中文 命名 实体 识别 机器人 语言 指令 分析 方法 系统 | ||
本发明公开了一种基于中文命名实体识别的机器人语言指令分析方法及系统,包括:基于输入指令内容获取中文文本信息;提取文本特征并进行特征增强;将增强后的特征输入命名体实体识别模型,产生每个汉字归属于每个命名实体类别的分数,构造重定位矩阵,将所述重定位矩阵用于实体类别推理,通过自监督的方式输出每个汉字的命名实体类别属性;基于提取到的命名实体驱动机器人执行相应的指令。本发明使用自监督学习机制进行中文命名实体识别的,这使我们的网络彻底摆脱了对人工标注数据集的依赖。
技术领域
本发明涉及语音识别技术领域,尤其涉及基于中文命名实体识别的机器人语言指令分析方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
机器人语音控制中的核心任务之一是对语言命令进行解析并抽取有用信息,并进行机器人本体控制。命名实体识别是提取语言信息的重要工具。命名实体是指真实对象的属性名称,如人员、组织、地点等。对文本进行命名实体的识别是理解文本深层含义的基础,它作为一个基本任务为许多后端自然语言处理的实际应用提供支持,如关系抽取、文本理解、信息抽取、机器翻译、实体语料库构建等。传统的命名体识别模型主要有三种:基于规则的学习方法,基于特征的监督学习方法,和基于无监督的学习方法。传统命名体识别主要是基于规则的方法。随着技术的发展,基于监督模型的命名体识别方法主导了NER任务,但基于监督的命名体识别网络大多数都需要使用大规模人工标注的数据集进行训练,获得数据集的成本高昂。而无监督或自监督学习的方式对命名实体进行识别,无需标注数据集即可对模型就行训练,在无监督或自监督训练模式下,如何为模型提供准确的学习方向或分类依据成了无监督命名体识别模型训练的关键。
早期无监督命名实体识别的解决方案有两种:一种是通过少量的已知数据构建常用字典,并以此作为聚类中心为模型提供分类依据;另一种是通过预置“种子”规则,一种包含语法信息或特殊提示词等先验信息的基础规则,作为词的分类标准并为模型提供聚类的依据。两种模型在通过先验信息提供聚类中心或分类依据之后,大多通过计算词汇上下文的相似性获得数据结构与分布特征,并从未标注的数据中提取命名实体。值得注意的是,无论哪种方法,其核心大多是以列表查找或模式匹配的方式实现命名实体的粗粒度提取。现阶段比较热门的无监督命名实体识别的方法可以分为判别式与生成式两类:判别式模型以传统方法为基础,通过设计更加合理的度量进行命名实体的细粒度提取;生成式模型则通过模型设计实现对具有最高生成概率的实体类别的最优细分。在研究人员的努力下,目前无监督命名实体识别方向取得了一些突破,但在中文命名实体提取中因为语句没有明显的单词边界,发展较为缓慢。此外,由于无监督模型需要结合足够的上下文信息,而在某些应用领域,如机器人语言命令解析,因为指令简洁词汇量很少,往往无法提供足够的上下文信息供无监督模型使用。
发明内容
为了解决上述问题,本发明提出了基于中文命名实体识别的机器人语言指令分析方法及系统,能够使模型免于复杂的参数训练以及特征预置或规则构建,进而摆脱对大规模手工标注数据集的依赖。
在一些实施方式中,采用如下技术方案:
基于中文命名实体识别的机器人语言指令分析方法,包括:
基于输入指令内容获取中文文本信息;
提取文本特征并进行特征增强;
将增强后的特征输入自监督中文命名体实体识别模型,产生每个汉字归属于每个命名实体类别的分数,构造重定位矩阵,根据重定位矩阵产生“复述”指令并将其用于实体类别推理,通过自监督的方式输出每个汉字的命名实体类别属性;
基于提取到的命名实体驱动机器人执行相应的指令。
其中,所述输入指令包括语音输入指令或者中文文本输入指令。
在另一些实施方式中,采用如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110236088.7/2.html,转载请声明来源钻瓜专利网。