[发明专利]面向海量非结构化文本的知识图谱自动构建方法及系统有效

申请号：	201810687745.8	申请日：	2018-06-28
公开（公告）号：	CN108875051B	公开（公告）日：	2020-04-28
发明（设计）人：	李世奇;程国艮	申请（专利权）人：	中译语通科技股份有限公司
主分类号：	G06F16/36	分类号：	G06F16/36;G06F16/338
代理公司：	北京万贝专利代理事务所(特殊普通合伙) 11520	代理人：	马红
地址：	100040 北京市石***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于计算机软件技术领域，公开了一种面向海量非结构化文本的知识图谱自动构建方法及系统，将命名实体识别问题抽象为一个序列标注问题：给定一个句子，为句子序列中的每一个字做标注；根据训练数据设计有效的特征，学习各类分类模型，使用训练好的分类器预测关系；链接多个现有知识，从顶层创建一个大规模的统一的知识网络；从三大在线百科、开放网站、相关知识库或搜索引擎日志中抓取实体信息并进行整合。本发明能够大幅提高知识图谱的构建速度，提高时间效率，降低人力资源成本30％以上。同时，本发明具有较好的领域移植性，在构建知识图谱时，仅需对本发明中的实体和关系抽取算法进行优化，即可迅速实现。
搜索关键词：	面向海量结构文本知识图谱自动构建方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种面向海量非结构化文本的知识图谱自动构建方法，其特征在于，所述面向海量非结构化文本的知识图谱自动构建方法为：(1)给定一个句子，为句子序列中的每一个字做标注；(2)根据训练数据设计有效的特征，学习各类分类模型，使用训练好的分类器预测关系；(3)链接多个现有知识，从顶层创建一个大规模的统一的知识网络；(4)从三大在线百科、开放网站、相关知识库或搜索引擎日志中抓取实体信息并进行整合。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司，未经中译语通科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810687745.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]面向海量非结构化文本的知识图谱自动构建方法及系统有效

专利文献下载