[发明专利]一种文本语义分析方法及系统在审
申请号: | 202010070024.X | 申请日: | 2020-01-21 |
公开(公告)号: | CN111241849A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 胡顺仁;马宇航 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06N3/04 |
代理公司: | 重庆华科专利事务所 50123 | 代理人: | 康海燕 |
地址: | 400054 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 语义 分析 方法 系统 | ||
本发明提供了一种文本语义分析方法及系统,包括:提取表示文本语义的文本向量,然后将文本向量输入到基于卷积神经网络包含有TextCNN与FastCNN中的网络结构进行特征提取。通过在TextCNN增加卷积核的种类或数量,增加了该网络结构的宽度,使得卷积层的特征提取能力大大增强,采用类似于“残差神经网络结构”的连接方式,使得卷积层输出的第一向量与被FastCNN网络结构压缩的文本向量联结形成第二向量,第二向量经过全连接层传输至输出层,得到文本向量分类各类别的概率。使得从文本语义提取到的初始文本向量通过TextCNN的卷积池化非线性处理与FastCNN的线性处理等筛选方式映射为一系列隐性文本向量,实现了更加高效且精准地获取到文本向量的分类结果。
技术领域
本发明涉及计算机人工智能的技术领域,尤其涉及一种文本语义分析方法及系统。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,也是计算机科学的一个分支,它企图了解智能思维模式的实质,并生产出一种新的能与人类思维模式相近,且同样能做出相应反应的智能机器。该领域的研究方向包括机器人、语言识别、图像识别和自然语言处理等,其中,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。市场上的众多APP软件都会向用户终端主动推送一些文本语义相关的新闻。但是推送的内容,一些用户可能对此不感兴趣,长时间地被迫接受不感兴趣的新闻内容,可能会影响到用户的使用体验,因此需要通过人工智能的方法,对推送内容进行筛选,但是一般的推送有效内容信息的效率并不高。
目前,在人工智能领域的自然语言筛选方面以卷积神经网络为代表的深度学习更为突出,通过卷积神经网络能以更高的效率提取出更加优化的隐藏特征,用于反映自然语言文本中所包含的语义信息。
因此,有必要开发一种文本语义分析方法及系统。
发明内容
有鉴于此,本发明的目的在于提供一种文本语义分析方法及系统,更加高效地解决在精准提取有效文本向量的技术问题。
第一方面,本发明提供了一种文本语义分析方法,包括:提取表示所述文本语义的文本向量;将所述文本向量输入到网络结构中,其中,所述网络结构包括TextCNN网络结构与FastCNN网络结构,基于卷积神经网络对文本向量进行特征提取;获取所述网络结构输出的文本特征向量。
进一步地,将所述文本向量输入到所述网络结构中,具体步骤包括:将提取到的表示所述文本语义的文本向量输入至四种不同类型的卷积核中,在卷积层进行卷积处理;当提取到的所述文本语义的文本向量在卷积层完成卷积处理后,通过Chunk-Maxpooling在池化层进行池化处理,得到四类隐形特征矩阵;在得到所述四类隐形特征矩阵后,通过Flatten层将四类隐形特征矩阵展平为一维向量,通过Concatenate层后拼接为第一向量。
进一步地,所述四种不同类型的卷积核包括:5行一维卷积窗口、4行一维卷积窗口、3行一维卷积窗口和2行一维卷积窗口,其中,每种一维卷积窗口上的卷积核数量为三位数的数量级。
进一步地,所述第一向量与被所述FastCNN网络结构压缩的文本向量联结形成第二向量,所述第二向量经过全连接层传输至输出层,得到所述网络结构输出的文本特征向量。
进一步地,所述文本特征向量包括文本向量分类各类别的概率。
第二方面,本发明还提供了一种文本语义分析系统,所述文本语义分析系统包括:提取单元,用于提取表示所述文本语义的文本向量;输入单元,用于将所述文本向量输入到网络结构中,其中,所述网络结构包括TextCNN网络结构与FastCNN网络结构,基于卷积神经网络对文本向量进行特征提取;获取单元,用于获取所述网络结构输出的文本特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010070024.X/2.html,转载请声明来源钻瓜专利网。