[发明专利]一种POI信息获取的方法及装置在审
| 申请号: | 201910907458.8 | 申请日: | 2019-09-24 |
| 公开(公告)号: | CN111858787A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 陶言祺;陈欢 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/906;G06F16/9537 |
| 代理公司: | 北京超成律师事务所 11646 | 代理人: | 吴迪 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 poi 信息 获取 方法 装置 | ||
本申请提供一种POI信息获取的方法及装置;该方法包括:获取用户通过客户端输入的检索信息,并将检索信息输入预先训练的命名实体识别模型中,识别检索信息中的命名实体;若识别出的命名实体中包括用于表征地理位置的目标命名实体,则根据目标命名实体确定目标检索区域;目标检索区域以与目标命名实体对应的POI信息为中心;根据命名实体中除目标命名实体的其他命名实体,从目标检索区域内检索并获取与检索信息对应的至少一条目标POI信息。该方法能够通过对检索信息中实体的类别进行识别,并通过识别出的能够表征地理位置的目标命名实体和其他命名实体进行分步检索获取目标POI信息,提升POI信息获取的准确率。
技术领域
本申请涉及信息检索技术领域,具体而言,涉及一种POI信息获取的方法及装置。
背景技术
信息检索在很多领域占据着重要的地位。在很多应用场景中,会根据用户输入的检索信息为用户检索获取和展示多个检索结果。例如在网约车领域,用户会通过客户端的人机交互界面输入用于描述其目的地的检索信息,客户端客户端会根据用户输入的检索信息进行POI的获取。在数据库中,兴趣点(PointofInterest,POI)的存储形式一般为:建筑物(或者目标地)的名称与该名称对应的地理位置坐标。检索结果的获取方式一般为基于用户输入的检索信息中的关键词,与数据库中存储的一定区域范围内的各个POI进行匹配,并将匹配成功的POI作为检索结果进行获取。关键词一般为检索信息中的命名实体,命名实体主要包括人名、地名、机构名、专有名词等。POI的命名实体类型通常为地名、机构名或者专有名词。
但是实际上,用户在检索时输入的检索信息通常会包括两个或者多个命名实体;当前的检索策略存在获取检索信息对应的检索结果时,往往无法挖掘出检索信息的潜在涵义,所获取的检索结果往往并非是用户想要真正获得的结果,存在获取POI获取准确率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种POI信息获取的方法及装置,能够通过对检索信息中实体的类别进行识别,并通过识别出的能够表征地理位置的目标命名实体和其他命名实体进行分步检索获取目标POI信息,提升POI信息获取的准确率。
第一方面,提供一种兴趣点POI信息获取的方法,该信息获取方法包括:
获取用户通过客户端输入的检索信息,并将所述检索信息输入预先训练的命名实体识别模型中,识别所述检索信息中的命名实体;
若识别出的所述命名实体中包括用于表征地理位置的目标命名实体,则根据所述目标命名实体确定目标检索区域;所述目标检索区域以与所述目标命名实体对应的POI信息为中心;
根据所述命名实体中除所述目标命名实体的其他命名实体,从所述目标检索区域内检索并获取与所述检索信息对应的至少一条目标POI信息。
一种可选实施方式中,采用下述方式训练所述命名实体识别模型:
获取多个样本文本,以及与每个所述样本文本对应的标签标注序列;所述标签标注序列中包括多个与构成所述样本文本的多个字符串一一对应的实体类型标注标签;
针对每个所述样本文本,将该样本文本输入至条件随机场模型,确定与该样本文本对应的多个标签预测序列中每个标签预测序列分别对应的得分;所述标签标注序列为多个所述标签预测序列中的一个;
根据所述得分,对所述条件随机场模型进行训练,得到所述命名实体识别模型。
一种可选实施方式中,所述确定与所述样本文本对应的多个标签预测序列中每个标签预测序列分别对应的得分,包括:
基于所述条件随机场模型,针对每个标签预测序列,根据概率转移矩阵,确定该标签预测序列中每两个位置相邻的预测标签对应的转移概率;
根据该标签预测序列中每两个位置相邻的预测标签对应的转移概率,确定该标签预测序列对应的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910907458.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在数据中心中初始化服务器配置
- 下一篇:兴趣点查询方法、装置以及电子设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





