[发明专利]词库更新方法、装置、电子设备及可读存储介质在审
申请号: | 201811247778.7 | 申请日: | 2018-10-24 |
公开(公告)号: | CN111090737A | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | 何鹏;王伟玮;王杰 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/23 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种词库更新方法、装置、电子设备及可读存储介质,属于数据处理领域。该方法包括:获取文本数据;将所述文本数据输入至预先训练好的条件随机场CRF模型中,输出所述文本数据中每个字的属性信息;根据所述每个字的属性信息从所述文本数据中提取多个扩充词;基于所述多个扩充词对预先建立的基础词库进行更新。本方案中,通过CRF模型获得文本数据中每个字的属性信息,然后根据每个字的属性信息从文本数据中提取多个扩充词,且扩充词的属性信息较为准确,由于文本数据的数据量大,由此,可以通过多个扩充词对预先建立的基础词库进行更新,从而提高了基础词库的数据质量和数据规模,降低了人工对基础词库进行更新的人力成本。 | ||
搜索关键词: | 词库 更新 方法 装置 电子设备 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811247778.7/,转载请声明来源钻瓜专利网。