[发明专利]一种基于聚类算法的无监督学习多点匹配方法在审
申请号: | 202010470688.5 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111737460A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 陈明东;黄越 | 申请(专利权)人: | 思派健康产业投资有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06K9/62 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国强 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于聚类算法的无监督学习多点匹配方法,包括S1、对短文本库进行预处理,以获取映射关系为短文本‑短文本的分词‑分词所包含的字的第一类映射链条,并根据第一类映射链条获取映射关系为字‑分词‑短文本的第二类映射链条;S2、输入待匹配文本,将待匹配文本打散为单个字,利用第二类映射链条将单个字映射到分词中,并将分词映射到短文本中,根据各个字在待匹配文本中的位置,矢量描述每一个短文本对待匹配文本的引用关系,以获取短文本库的引用矩阵等步骤。优点是:通过并行的多点匹配,使得算法可以一次性地将可能匹配到的短文本全部提取出来,提高了匹配效率,避免了对一个待匹配文本的循环匹配。 | ||
搜索关键词: | 一种 基于 算法 监督 学习 多点 匹配 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思派健康产业投资有限公司,未经思派健康产业投资有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010470688.5/,转载请声明来源钻瓜专利网。