首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于语境的依存句法树的构建方法在审

申请号：	201811617009.1	申请日：	2018-12-27
公开（公告）号：	CN109684644A	公开（公告）日：	2019-04-26
发明（设计）人：	石进;韩进;金鹏	申请（专利权）人：	南京大学
主分类号：	G06F17/27	分类号：	G06F17/27;G06F16/35
代理公司：	南京中高专利代理有限公司 32333	代理人：	祝进
地址：	210023 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语境构建核心词片段序列句子集合去除归属
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及语境核心词提取领域，具体为一种基于语境的依存句法树的构建方法，其包括：步骤S100，获取句子；步骤S200，通过核心词判断将句子切分形成片段序列；步骤S300，判断片段序列之间的中间词的归属语境；步骤S400，去除单个词的语境，获得最小语境集合；以及步骤S500，基于最小语境集合构建依存句法树。实现了基于核心词进行依存句法树的构建。

技术领域

本发明涉及语境核心词提取领域，具体为一种基于语境的依存句法树的构建方法。

背景技术

当前国内外对于语境核心词提取算法的研究较少，更多的是对于关键词提取算法的研究。基于核心词构建依存句法树对于文本特征提取具有良好的性能。

基于上述技术问题，需要设计一种新的基于语境的依存句法树的构建方法。

发明内容

本发明的目的是提供一种基于语境的依存句法树的构建方法。

为了解决上述技术问题，本发明提供了一种基于语境的依存句法树的构建方法，包括：

步骤S100，获取句子；

步骤S200，通过核心词判断将句子切分形成片段序列；

步骤S300，判断片段序列之间的中间词的归属语境；

步骤S400，去除单个词的语境，获得最小语境集合；以及

步骤S500，基于最小语境集合构建依存句法树。

进一步，所述步骤S100中获取句子的方法包括：

初始化词字典，针对训练文本集中每个文本D，将文本D拆分成句子集合S。

进一步，所述步骤S200中通过核心词判断将句子切分形成片段序列的方法包括：

基于熵对比的语境核心词判断算法将句子切分形成片段序列，即

步骤S201，遍历句子集合S，将其中每一个句子拆分成n个词形成词集合W_S；

步骤S202，针对词集合W_S中每个词w_i，i∈n计算其与词集合中任一词的共现次数；

步骤S203，查找词字典中词w_i，将词w_i与词集合W_S中的其它词w_j，j∈n按<w_j，count>累加；

步骤S204，针对词字典，进行遍历，求出每个词w_i的语境共现频率向量V_i，即将所有与词w_i具有共现关系的词，基于公式：其中w_j∈W_S且w_j≠w_i，m∈n，m＝n-1，获得语境共现频率向量V_i；

式中：为其他词w_j的共现频率；为其他词w_j和词w_i的共现次数；

步骤S205，基于公式计算出每个词的语境共现熵值H(V_i)，完成整个文本的训练；

步骤S206，针对文本集进行文本分类处理后得到的文本分类集中任一句子集合S，将其拆分成词集合W_S，遍历其中每个词w_i，根据词字典中词w_i对应的熵，逐一比较各词的语境共现熵值，具有最大语境共现熵值的词即为核心词；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811617009.1/2.html，转载请声明来源钻瓜专利网。

上一篇：基于句向量的文本识别方法、电子设备及计算机可读介质
下一篇：中文分词方法及装置

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top