[发明专利]一种移动应用的本体库的构建方法及系统有效
| 申请号: | 201210585905.0 | 申请日: | 2012-12-28 |
| 公开(公告)号: | CN103020293B | 公开(公告)日: | 2019-02-05 |
| 发明(设计)人: | 庞文博;杨锴 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953 |
| 代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 移动 应用 本体 构建 方法 系统 | ||
本发明提供了一种移动应用的本体库的构建方法,包括:将数据库中移动应用的标题和简介文本分别在预先生成的概念标签集合和属性标签集合中进行匹配,为匹配到的概念标签和属性标签分配权重值;依据权重值由高到低排序后的概念标签,从预先生成的概念标签树中获得概念标签路径;依据概念标签路径中的概念标签查询预先生成的概念标签与属性标签的关联关系,获得属性标签;利用获得的概念标签路径及关联的属性标签标注所述移动应用;本发明还提供一种移动应用的本体库的构建系统。根据本发明提供的技术方案,能够自动高效的为移动应用标注概念标签和属性标签。
【技术领域】
本发明涉及互联网应用领域,尤其涉及一种移动应用的本体库的构建方法及系统。
【背景技术】
随着移动网络和智能终端的迅猛发展,与移动应用(APP,Application)有关的需求也日益旺盛,例如,移动应用的检索、移动应用的推荐等。为了满足检索需求和推荐需求,目前在数据库中都存储有移动应用的类别信息和简介,用于移动应用的检索和推荐,移动应用的类别信息是由运维人员进行人工标注的,因此,移动应用的信息标注完全依赖于人工,数量快速增长的移动应用,如果仍然使用人工标注信息的方式,将给研发人员带来巨大工作量,耗费较多的人力物力,而且不能对新增移动应用进行及时标注,效率较低;此外,目前移动应用的类别信息的粒度比较粗略,不能有效地描述出移动应用之间的功能差异,也不能描述出移动应用的属性特征。因此,为了能够满足移动应用的各种需求,构建出有效描述移动应用功能和属性的知识体系是亟待解决的问题。
【发明内容】
本发明提供了一种移动应用的本体库的构建方法及系统,能够自动高效的为移动应用标注概念标签和属性标签。
本发明的具体技术方案如下:
根据本发明一优选实施例,一种移动应用的本体库的构建方法,包括:
将数据库中移动应用的标题和简介文本分别在预先生成的概念标签集合和 属性标签集合中进行匹配,为匹配到的概念标签和属性标签分配权重值;
依据权重值由高到低排序后的概念标签,从预先生成的概念标签树中获得概念标签路径;依据概念标签路径中的概念标签查询预先生成的概念标签与属性标签的关联关系,获得属性标签;
利用获得的概念标签路径及关联的属性标签标注所述移动应用。
上述方法中,概念标签集合和属性标签集合的生成方法为:
依据预设的移动应用概念的文本模式和移动应用属性的文本模式,从移动应用的简介文本中抽取出概念标签和属性标签;
将用户检索的query与依据移动应用的简介文本生成的概念标签合并得到概念标签集合,利用依据移动应用的简介文本生成的属性标签生成属性标签集合。
上述方法中,所述概念标签树依据概念标签集合中概念标签之间的从属关系生成,并包括一个以上概念标签路径,所述概念标签路径包括一个以上概念标签。
上述方法中,所述将数据库中移动应用的标题和简介文本分别在预先生成的概念标签集合和属性标签集合中进行匹配具体包括:
对数据库中移动应用的标题和简介文本进行切词,生成一个以上分词,依据预设的同义词表,找到生成的分词的同义词,依据生成的分词和找到的同义词分别在概念标签集合和属性标签集合中进行字符串匹配;
依据预设的移动应用概念的文本模式对移动应用的标题和简介文本分别进行模式匹配。
上述方法中,利用如下公式获得概念标签和属性标签的权重值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210585905.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种线路板压合填胶的方法
- 下一篇:一种搜索项建议方法和装置





