[发明专利]一种属性信息的获取方法及装置、推送方法及装置在审
申请号: | 201410425516.0 | 申请日: | 2014-08-26 |
公开(公告)号: | CN104199898A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 马小龙 | 申请(专利权)人: | 北京小度互娱科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王艳春;熊苹 |
地址: | 100193 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 属性 信息 获取 方法 装置 推送 | ||
本发明实施例提供了一种属性信息的获取方法,包括:依据语料库中的文本信息,获得N个关键词,N为大于或者等于1的整数;获得M个候选词,所述M个候选词为N个关键词中的M个关键词或者标签库中的M个标签,M为大于0且小于或者等于N的整数;依据所述M个候选词中第i个候选词与所述N个关键词中每个所述关键词的共现概率,从所述M个候选词中选择K个候选词,以作为所述文本信息对应的对象的属性信息,i的取值为1到M中的整数,K为小于或者等于M且大于0的整数;本发明实施例还提供一种属性信息的获取装置、推送方法及装置。本发明实施例提供的技术方案可以实现提高获得对象的属性信息的准确性。
【技术领域】
本发明涉及互联网应用技术,尤其涉及一种属性信息的获取方法及装置、推送方法及装置。
【背景技术】
目前,获得对象的属性信息的方法是:对对象对应的文本信息进行切词处理,获得若干分词;对于每个分词,依据该分词在语料库中文本信息的出现次数的倒数,获得该分词的权重值;将所有分词中权重值最高的若干分词作为该对象的关键词,并进行存储。这样,当需要依据检索词进行检索时,可以依据检索词和存储的对象的关键词,获得与检索词相匹配的对象,然后将与检索词相匹配的对象推送给用户。
然而,由于依据分词在语料库中文本信息的出现次数的倒数,获得该分词的权重值,因此分词的出现次数越高,该分词的权重值越低,使得该分词不会作为对象的关键词,而出现次数较少的分词将作为对象的关键词,往往出现次数较高的分词是对象的主要关键词,因此,目前获得对象的属性信息的准确性比较低。
【发明内容】
有鉴于此,本发明实施例提供了一种属性信息的获取方法及装置、推送方法及装置,可以实现提高获得对象的属性信息的准确性。
本发明实施例提供了一种属性信息的获取方法,包括:
依据语料库中的文本信息,获得N个关键词,N为大于或者等于1的整数;
获得M个候选词,所述M个候选词为所述N个关键词中的M个关键词或者标签库中的M个标签,M为大于0且小于或者等于N的整数;
依据所述M个候选词中第i个候选词与所述N个关键词中每个所述关键词的共现概率,从所述M个候选词中选择K个候选词,以作为所述文本信息对应的对象的属性信息,i的取值为1到M中的整数,K为小于或者等于M且大于0的整数。
上述方法中,所述依据语料库中的文本信息,获得N个关键词,包括:
获得所述语料库中的文本信息;
对所述文本信息进行切词处理,以获得所述N个关键词。
上述方法中,所述依据所述M个候选词中第i个候选词与所述N个关键词中每个所述关键词的共现概率,从所述M个候选词中选择K个候选词,包括:
依据所述M个候选词中第i个候选词与所述N个关键词中每个所述关键词的共现概率,获得所述第i个候选词的权重值;
依据所述M个候选词的权重值,从所述M个候选词中选择K个候选词,以作为所述文本信息对应的对象的属性信息。
上述方法中,所述依据所述M个候选词中第i个候选词与所述N个关键词中每个所述关键词的共现概率,获得所述第i个候选词的权重值,包括:
获得所述M个候选词中第i个候选词与所述N个关键词中每个所述关键词的共现概率;
获得所述共现概率的累加和;
依据所述第i个候选词的先验概率和所述累加和,获得所述第i个候选词的权重值;其中,所述第i个候选词的先验概率为依据所述第i个候选词的搜索次数获得的。
上述方法中,所述依据所述M个候选词的权重值,从所述M个候选词中选择K个候选词,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小度互娱科技有限公司,未经北京小度互娱科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410425516.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置