[发明专利]一种新术语识别方法有效

申请号：	201510845390.7	申请日：	2015-11-27
公开（公告）号：	CN106815187B	公开（公告）日：	2020-04-14
发明（设计）人：	符建辉;王卫明;曹阳	申请（专利权）人：	中科国力（镇江）智能技术有限公司
主分类号：	G06F40/279	分类号：	G06F40/279;G06F40/284
代理公司：	南京知识律师事务所 32207	代理人：	高娇阳
地址：	212009 江苏省镇江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种新术语识别系统和方法，其系统包括对输入文本库RCorpus中的每篇文档进行分词，形成文本词序列模块A；对分词后的文本库TCorpus中的每篇文档词语序列进行新术语识别模块B；对识别的新术语进行验证模块C；其方法包括以下步骤：第一步：文本词序列模块A对输入文本库RCorpus中的每篇文本进行分词，形成文本词序列；第二步：新术语识别模块B对分词后的文本库TCorpus中的每篇文本词语序列进行新术语识别；第三步：验证模块C对识别的新术语进行验证；本发明提出了一种精度高、召回率高的新术语识别方法和系统。新术语的识别精度为93.8％。
搜索关键词：	一种术语识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种高效的新术语识别系统，其特征在于：包括对输入文本库RCorpus中的每篇文档进行分词，形成文本词序列模块A；对分词后的文本库TCorpus中的每篇文档词语序列进行新术语识别模块B；对识别的新术语进行验证模块C；上面所述模块中，模块A对输入文本库RCorpus中的每篇文挡进行分词，形成分词后的文本词序列，因此形成分词后的文本库TCorpus，供新术语识别模块B使用；新术语识别模块B对分词后的文本库TCorpus中的每篇文档进行新术语识别，形成一组待验证的新术语结果，供验证模块C使用；验证模块C对新术语识别模块B识别的新术语进行进一步的验证。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中科国力（镇江）智能技术有限公司，未经中科国力（镇江）智能技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510845390.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种新术语识别方法有效

专利文献下载