[发明专利]语义工程平台的构建方法及语义工程平台在审
| 申请号: | 202110601515.7 | 申请日: | 2021-05-31 |
| 公开(公告)号: | CN113408294A | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 朱平;史进 | 申请(专利权)人: | 北京泰豪智能工程有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06F40/211 |
| 代理公司: | 北京慧智兴达知识产权代理有限公司 11615 | 代理人: | 李丽颖 |
| 地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义 工程 平台 构建 方法 | ||
本发明提出了一种语义工程平台的构建方法及语义工程平台,所述语义工程平台的构建方法包括:从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合;对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例;根据得到的语义表示实例数据构建面向问题的语义工程平台。本发明能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,构建了面向问题的语义工程平台,为实现真正的类人思维的求解提供数据基础。
技术领域
本发明涉及计算机自然语言技术领域,尤其涉及一种语义工程平台的构建方法及语义工程平台。
背景技术
目前,现有的自然语言初等数学应用题求解技术,都是采用支持向量机等机器学习算法进行语义识别,没有“类人”的中间步骤,直接求解结果,结果也不尽如人意。而对于自然语言数学应用题类人机器求解方式,由于自然语言的表述形式几乎是无限的,因此对于语义处理问题而言,语义特征稀疏问题十分突出。这使得众多以数据为基础的机器学习算法对自然语言模型匹配无从下手。要解决这个问题,一要发展适应语义表示稀疏问题的新算法;二要建设语义工程平台积累语料和语义表示数据。
可见,如何构建语义工程平台以实现积累语料和语义表示数据,对于自然语言数学应用题类人机器求解具有重要意义。
发明内容
基于上述技术问题,本发明提出了一种语义工程平台的构建方法及语义工程平台,能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,构建了面向问题的语义工程平台,为实现真正的类人思维的求解提供数据基础。
本发明提供了一种语义工程平台的构建方法,所述方法包括:
从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合;
对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例;
根据得到的语义表示实例数据构建面向问题的语义工程平台。
进一步地,所述对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,包括:
识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,数据元包含表征数字量的数字串和表征数据提问的汉字串;
提取所述数据元所处的上下文分词和语义预处理后的词汇流,根据得到的上下文分词和词汇流构建对应数据元变量的子句框架库与语义特征库;
识别语义工程问题中的上下文显式数值关系,所述上下文显式数值关系为数据元变量之间的显式数值关系,根据得到的上下文显式数值关系构建对应数据元变量的语义导图库;
识别语义工程问题中的数据元变量的逻辑关系,所述数据元变量的逻辑关系为变量之间的直接运算关系,根据得到的逻辑关系构建对应数据元变量的语义导图库;
所述子句框架库和语义特征库构成数据元变量的语料实例;
所述子句框架库和语义导图库构成变量之间的数值关系的语义实例;
所述子句框架库、语义特征库和语义导图库构成变量的逻辑关系的语义实例。
进一步地,所述识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,包括:
对提取的语义工程问题进行分词处理,分词后通过量词识别、概念属性识别、概念关系识别、指代识别、时间分段识别和/或常识关系识别,依次识别出语义工程问题中的数据元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京泰豪智能工程有限公司,未经北京泰豪智能工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110601515.7/2.html,转载请声明来源钻瓜专利网。





