[发明专利]短文本语义理解模板检验方法、模板生成方法及装置在审
申请号: | 202011364644.0 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112395394A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 李晓霞 | 申请(专利权)人: | 安徽迪科数金科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F40/30 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 张乾桢 |
地址: | 230088 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 语义 理解 模板 检验 方法 生成 装置 | ||
一种短文本语义理解模板检验方法、模板生成方法及装置,所述方法包括:步骤E1处理第1条待语义理解的短文本,对初步生成和/或优化过对应若干条规则模板的第1条待语义理解的短文本进行分类,转存成已完成语义理解的短文本,同时存储其与对应的若干个预设基础语义组、及对应的若干条规则模板建立的正确匹配关系;步骤E2处理非第1条待语义理解的短文本,交互检验非第1条正在处理的待语义理解的短文本初步生成和/或优化过的若干条规则模板和现有的所有规则模板,交互检验通过后,同样进行分类、转存以及存储对应的匹配关系;步骤E3对待语义理解的其余短文本,循环步骤E2,实现每条待语义理解的短文本的分类过程中都使用交互检验,每条规则模板反复经过交互检验。
技术领域
本申请涉及自然语言语义理解领域,尤其涉及一种短文本语义理解模板检验方法、模板生成方法及装置。
背景技术
通过对人类自然语言的识别、理解、表达进行的人机智能交互给人们的生活带来了极大便利,随着语音识别准确率及泛化能力的不断提高,人机智能交互逐渐应用于各种产品中,并被大众熟悉。其中影响推广应用和大众体验的关键技术之一是对自然语言经语音识别后的短文本的理解。
目前短文本理解方法大致分为基于匹配模板和基于机器学习模型的方法。前者多为关键词提取、(分词后)同义合并,abnf文法。现有的方法流程繁琐、冗余难于管理,难以平衡准确率和匹配率,处理不了相对复杂的语义的分类,比如,局部语义与整体语义不一致、实际交互场景中人端口语化而非严格书面语言的表达、实际交互场景中不同语义宽窄的需求。基于机器学习模型的方法需要先有大量实际场景互动数据,耗时去标注,专业研发人员去训练,才能得到达到一定准确率的模型,启动成本昂贵,小型或者非专业企业很难使用,进一步导致没办法产生实际场景互动数据。
发明内容
本申请提供了一种短文本语义理解模板检验方法、模板生成方法及装置,目的在于解决缺少实际生产数据情况下,现有技术中,短文本语义理解泛化过程中准确率不可把控、人工生成模板难度较大、质量检验困难的问题。本申请通过第一预设数量的短文本对预设基础模板组集合的交互检验实现了保证可控准确率前提下短文本语义理解处理泛化能力的提高,同时降低了整套语义理解模板生成方法的难度,加大了程序化作业,便于批量、在线、灵活、应急生成和/或优化更改语义理解模板。
为了实现上述目的,本申请提供了以下技术方案:
一种短文本语义理解模板检验方法,包括:
步骤E1:处理第1条待语义理解的短文本,对初步生成和/或优化过对应若干条规则模板的第1条待语义理解的短文本进行分类,转存成已完成语义理解的短文本,同时存储其与对应的若干个预设基础语义组、及对应的若干条规则模板建立的正确匹配关系,所述正确匹配关系指某条短文本只会匹配中包含其语义的若干个预设基础语义组对应的若干条规则模板,与预设基础语义组集合中剩余预设基础语义组对应的预设基础模板组子集中任一条规则模板之间是不匹配的关系;
步骤E2:处理非第1条待语义理解的短文本,交互检验非第1条正在处理的待语义理解的短文本初步生成和/或优化过的若干条规则模板和现有的所有规则模板,交互检验通过后,对非第1条正在处理的待语义理解的短文本进行分类,转存成已完成语义理解的短文本,同时存储其与对应的若干个预设基础语义组、及对应的若干条规则模板建立的正确匹配关系,所述交互检验指正在处理的某条待语义理解的短文本与对应若干个语义组及对应的若干条规则模板建立正确匹配关系,已完成语义理解的所有短文本分别与现有规则模板集合中对应的若干条规则模板建立正确匹配关系;
步骤E3:对待语义理解的短文本中的第2条到第一预设数量条,循环重复上面的步骤E2,实现每条待语义理解的短文本的分类过程中都使用交互检验,每条规则模板反复经过交互检验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽迪科数金科技有限公司,未经安徽迪科数金科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011364644.0/2.html,转载请声明来源钻瓜专利网。