[发明专利]一种移动应用的本体库的构建方法及系统有效
| 申请号: | 201210585905.0 | 申请日: | 2012-12-28 |
| 公开(公告)号: | CN103020293B | 公开(公告)日: | 2019-02-05 |
| 发明(设计)人: | 庞文博;杨锴 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953 |
| 代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 移动 应用 本体 构建 方法 系统 | ||
1.一种移动应用的本体库的构建方法,其特征在于,该方法包括:
将数据库中移动应用的标题和简介文本分别在预先生成的概念标签集合和属性标签集合中进行匹配,为匹配到的概念标签和属性标签分配权重值;
依据权重值由高到低排序后的概念标签,从预先生成的概念标签树中获得概念标签路径;依据概念标签路径中的概念标签查询预先生成的概念标签与属性标签的关联关系,获得属性标签;
利用获得的概念标签路径及关联的属性标签标注所述移动应用。
2.根据权利要求1所述的方法,其特征在于,概念标签集合和属性标签集合的生成方法为:
依据预设的移动应用概念的文本模式和移动应用属性的文本模式,从移动应用的简介文本中抽取出概念标签和属性标签;
将用户检索的query与依据移动应用的简介文本生成的概念标签合并得到概念标签集合,利用依据移动应用的简介文本生成的属性标签生成属性标签集合。
3.根据权利要求1所述的方法,其特征在于,
所述概念标签树依据概念标签集合中概念标签之间的从属关系生成,并包括一个以上概念标签路径,所述概念标签路径包括一个以上概念标签。
4.根据权利要求1所述的方法,其特征在于,所述将数据库中移动应用的标题和简介文本分别在预先生成的概念标签集合和属性标签集合中进行匹配具体包括:
对数据库中移动应用的标题和简介文本进行切词,生成一个以上分词,依据预设的同义词表,找到生成的分词的同义词,依据生成的分词和找到的同义词分别在概念标签集合和属性标签集合中进行字符串匹配;
依据预设的移动应用概念的文本模式对移动应用的标题和简介文本分别进行模式匹配。
5.根据权利要求1所 述的方法,其特征在于,利用如下公式获得概念标签和属性标签的权重值:
其中,Score(app,tag)为移动应用app中标签tag的权重值,∑(WordScoretag+PatternScoretag)为在移动应用app中标签tag各次成功匹配的权重值的和,为在移动应用app中标签tag的子标签childtag各次成功匹配的权重值的和,为移动应用app中标签tag的各子标签childtag的权重值的和。
6.根据权利要求5所述的方法,其特征在于,利用如下公式获得移动应用app中标签tag的字符串匹配的权重值WordScoretag:
其中,BaseScoretitle为在标题中匹配成功的标签的基准权重值,ReverseSiteword为在标题中匹配成功的标签在标题的切词结果中依据由后向前的顺序的所处位置,BaseScorecontent为在简介文本中匹配成功的标签的基准权重值,Siteclause为在标题中匹配成功的标签在简介文本的切词结果中依据由前向后的顺序的所处短句的位置。
7.根据权利要求5所述的方法,其特征在于,利用如下公式获得移动应用app中标签tag的模式匹配的权重值PatternScoretag:
其中,StrictPatternScoretag等于10,LoosePatternScoretag等于8。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210585905.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种线路板压合填胶的方法
- 下一篇:一种搜索项建议方法和装置





