[发明专利]一种基于加入文本信息的词向量的中文语法错误检测方法有效

申请号：	201810741530.X	申请日：	2018-07-06
公开（公告）号：	CN108984525B	公开（公告）日：	2019-07-12
发明（设计）人：	赵建博;李思;李明正;徐雅静	申请（专利权）人：	北京邮电大学
主分类号：	G06F17/27	分类号：	G06F17/27;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种加入文本信息的词向量的中文语法错误检测方法及装置，属于信息处理领域。该方法的特征包括：先对输入的文本的词语进行向量化，形成文本矩阵；再利用循环神经网络形成各词向量相关的文本信息；重建文本矩阵；利用循环神经网络提取上下文信息；之后利用前向神经网络计算各个词语错误性得分；使用错误性得分推断错误位置。本发明通过结合基于文本化词向量，使得中文语法检测效果得到提升，具有很大的使用价值。
搜索关键词：	词向量文本信息循环神经网络语法错误检测文本矩阵错误性中文词语前向神经网络信息处理领域上下文信息错误位置语法检测文本化向量化再利用推断文本重建
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于加入文本信息的词向量的中文语法错误检测方法，其特征在于，所述方法包含以下结构和步骤：(1)文本词语的向量化：对输入文本中的词语进行映射，将各个词语映射为相应的词向量，已分词的文本即数值化为各个词语的词向量连接而成的文本矩阵；(2)循环神经网络形成各词向量相关的文本信息：对步骤(1)得到的文本矩阵进行处理，利用循环神经网络捕获各个词对应的上下文信息，得到关于各词向量相关的文本信息；(3)文本矩阵重建：对步骤(1)中的各个词语映射为相应的词向量使用步骤(2)得到的各词向量相关的文本信息进行处理，得到加入文本信息的词向量表示的文本矩阵；(4)循环神经网络提取上下文信息：对步骤(3)得到的加入文本信息的词向量表示的文本矩阵进行处理，利用循环神经网络提取上下文信息，得到文本中各个词向量对应的特征表示；(5)前向神经网络计算各个词语错误性得分：对步骤(4)中得到的文本中各个词向量对应的特征表示进行处理，特征表示经过一个前向神经网络得到文本中各个词语的错误性得分；(6)使用错误性得分推断错误位置：对步骤(5)得到的文本中各个词语的错误性得分进行处理，在整个文本层面对各个词语的错误性得分进行推断，得到错误词语的相关信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810741530.X/，转载请声明来源钻瓜专利网。

上一篇：一种基于变分神经网络主题模型的标题生成方法
下一篇：一种基于深度学习的文档主题向量抽取方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于加入文本信息的词向量的中文语法错误检测方法有效

专利文献下载