首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种网络语境的文本识别方法、装置及存储介质有效

申请号：	202010396183.9	申请日：	2020-05-12
公开（公告）号：	CN111581970B	公开（公告）日：	2023-01-24
发明（设计）人：	陈思萌;何星;赵建强;陈诚;邓叶勋;郑伟斌;刘晓芳;张辉极;杜新胜	申请（专利权）人：	厦门市美亚柏科信息股份有限公司
主分类号：	G06F40/289	分类号：	G06F40/289;G06F40/30;G06F40/126;G06F40/216;G06N3/048;G06N3/09
代理公司：	厦门福贝知识产权代理事务所(普通合伙) 35235	代理人：	陈远洋
地址：	361000 福建省厦门市思明***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种网络语境文本识别方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种网络语境的文本识别方法，其特征在于，该方法包括：

建模步骤，基于文本长窗口构建风格语义模型，基于文本短窗口构建偏旁级语义模型；

训练步骤，使用网络语境的语料库基于风格语义模型向量模型和偏旁级语义模型训练得到网络语境的中文词向量模型；

识别步骤，使用所述网络语境的中文词向量模型对输入的网络语境的文本进行识别并输出识别结果；

将所述语料库任一条语料s分词后得到的语料序列为s＝{w₁,…w_t-1,w_t,w_t+1,…w_N}，其中，w_t为分词后序列中的第t个词语，设w_t为待预测的目标词，t＝1,…N，N为语料序列中的总词语数目；以目标词w_t为中心构建文本窗口，定义文本短窗口为：

其中，d_s表示文本短窗口中的词语到目标词w_t的距离，设文本短窗口的距离阈值为θ，window_s表示由邻近目标词w_t的上下文组成的词语集合；

定义文本长窗口为

其中，d_l代表文本长窗口的中的词语到目标词w_t的距离，最小值为θ+1，最大值为β，β≤N，window_l表示由距离目标词w_t距离较远的上下文组成，且不包括文本短窗口中的内容；

所述基于文本长窗口构建风格语义模型的过程为：将文本长窗口window_l作为CBOW的输入，计算隐藏层向量

式中，表示文本长窗口内目标词的上下文w_t+j所对应的编码向量，β表示文本长窗口内目标词w_t与上下文w_t+j之间的距离，文本长窗口的总长度为2β；

所述基于文本短窗口构建偏旁级语义模型的过程为：

将文本短窗口内的词语划分为汉字，得到短文本字序列

提取短文本字序列c中每个汉字的偏旁部首

通过字符转义字典将偏旁部首r转换为对应语义的汉字r^*，得到短文本和部首转义后的字序列x,

采用自注意力机制，将词语对应的汉字和部首进行加权融合编码，自注意力权重α的计算公式为：

α_i＝softmax(f(x^Tx_i))

其中，x_i表示文本短窗口内第i个词对应的短文本和部首转义后字序列，i∈{t±d_s|1d_s≤θ}，x^T为x_i的转置矩阵，相似度计算函数f采用点积形式；

文本短窗口内每个词语的编码向量为：

v_x＝∑_iα_iv_i

其中，α_i表示文本短窗口内词语x所对应字序列中第i个字的自注意力权重，v_i表示文本短窗口内词语x所对应字序列中第i个字的编码向量；

将自注意力得到的编码向量v_x输入CBOW，计算隐藏层的输出向量

式中，θ表示文本短窗口内目标词w_t与上下文w_t+j的距离，文本短窗口的总长度为2θ，表示文本短窗口内第t个目标词上下文所对应的编码向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司，未经厦门市美亚柏科信息股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010396183.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种道路雾架构环境下车辆结点信任值计算方法
下一篇：一种压缩机防回液控制方法、装置及空调器

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top