[发明专利]类簇的识别系统及方法在审
申请号: | 202010398000.7 | 申请日: | 2020-05-12 |
公开(公告)号: | CN111708880A | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 齐云飞;张杰;付骁弈 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/295 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王素燕;栗若木 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 系统 方法 | ||
本发明实施例公开了一种类簇的识别系统及方法,其中该系统部署有实体检测服务模块、实体聚类服务模块、簇连接服务模块;所述实体检测服务模块,设置为对待识别数据提取实体并确定所提取的每个实体各自的词向量;所述实体聚类服务模块,设置为对所述实体的词向量进行聚类得到聚类结果;所述簇连接服务模块,设置为根据所述聚类结果更新类簇。通过多个服务模块协同处理相关数据,大大提升了数据处理效率。
技术领域
本发明实施例涉及人工智能技术,尤指一种类簇的识别系统及方法。
背景技术
随着移动应用的普及,社交网络也成为了主流的媒体,比如微博等。在社交网络上跟踪事件发展趋势与走势可以对社会产生巨大价值,对事件链的跟踪需要一系列步骤,由于社交网络的特殊性,如何能快速识别事件,并得到事件链成为了一个难题。
目前,应用于自然语言处理的技术大多采用单机整合,即将一个比较大任务在高性能机器上运行,但即使这样运行效率依然堪忧。同样地,由于类簇识别是得到事件链的基础,采用单机识别类簇的方案同样存在数据处理效率低的问题。
发明内容
有鉴于此,本发明实施例提供了一种类簇的识别系统,所述系统部署有实体检测服务模块、实体聚类服务模块、簇连接服务模块;
所述实体检测服务模块,设置为对待识别数据提取实体并确定所提取的每个实体各自的词向量;
所述实体聚类服务模块,设置为对所述实体的词向量进行聚类得到聚类结果;
所述簇连接服务模块,设置为根据所述聚类结果更新类簇。
本发明实施例还提供了一种类簇的识别方法,应用于上述系统,包括:
实体检测服务模块对待识别数据提取实体并确定所提取的每个实体各自的词向量;
实体聚类服务模块对实体的词向量进行聚类得到聚类结果;
簇连接服务模块根据所述聚类结果更新类簇。
本发明实施例提供的技术方案,通过多个服务模块协同处理相关数据,从而大大提升了数据处理效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本发明一实施例提供的一种类簇的识别系统的结构示意图;
图2为本发明一实施例提供的一种类簇的识别方法的流程示意图;
图3为本发明另一实施例提供的一种类簇的识别系统的结构示意图;
图4为本发明另一实施例提供的一种类簇的识别方法的流程示意图;
图5为本发明另一实施例提供的一种类簇的识别系统的结构示意图;
图6为本发明另一实施例提供的一种类簇的识别方法的流程示意图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010398000.7/2.html,转载请声明来源钻瓜专利网。