[发明专利]一种短文本信息提取方法和装置在审
| 申请号: | 201710124224.7 | 申请日: | 2017-03-03 |
| 公开(公告)号: | CN108536666A | 公开(公告)日: | 2018-09-14 |
| 发明(设计)人: | 徐晓鹏;蒙睿;江金陵;丁若谷;冯是聪 | 申请(专利权)人: | 北京明略软件系统有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 胡艳华;李丹 |
| 地址: | 102218 北京市昌平区东小*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本文公开了一种短文本信息提取方法,该方法包括:对短文本训练集中的各个短文本进行聚类;建立每一个短文本类别的模型,并对所述模型中出现的命名实体进行标注;将目标短文本与各个短文本类别的模型进行匹配,在成功匹配到短文本模型后,根据所述短文本模型中的命名实体标注信息对所述目标短文本进行信息提取。本文能够自动从海量短文本数据中高效地提取出关注的信息,适应性好。 | ||
| 搜索关键词: | 短文本 信息提取 目标短文本 命名实体 匹配 方法和装置 标注信息 聚类 标注 成功 | ||
【主权项】:
1.一种短文本信息提取方法,该方法包括:对短文本训练集中的各个短文本进行聚类;建立每一个短文本类别的模型,并对所述模型中出现的命名实体进行标注;将目标短文本与各个短文本类别的模型进行匹配,在成功匹配到短文本模型后,根据所述短文本模型中的命名实体标注信息对所述目标短文本进行信息提取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710124224.7/,转载请声明来源钻瓜专利网。
- 上一篇:商品领域的知识融合方法
- 下一篇:中文文本识别方法及装置





