[发明专利]一种发布商品信息的方法及装置有效
申请号: | 201010187445.7 | 申请日: | 2010-05-27 |
公开(公告)号: | CN102262765A | 公开(公告)日: | 2011-11-30 |
发明(设计)人: | 林锋;张寿松;张勤 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发布 商品信息 方法 装置 | ||
1.一种发布商品信息的方法,其特征在于,包括:
接收用户输入的商品信息,并对所述商品信息进行解析;
根据解析结果获得所述商品信息的指定特征属性的取值,所述指定特征属性用于描述商品信息所包含词汇的罗列堆砌程度;
根据各指定特征属性的取值,基于最大熵原理,计算所述商品信息为罗列堆砌信息的置信度;
确定所述置信度达到设定阈值时,阻止发布所述商品信息。
2.根据权利要求1所述的方法,其特征在于,所述根据各指定特征属性的取值,基于最大熵原理,计算所述商品信息为罗列堆砌信息的置信度,包括:
将所述各指定特征属性的取值,作为基于最大熵原理的条件概率模型的给定信息;
采用条件概率模型计算在所述给定信息的情况下,所述商品信息为罗列堆砌信息的后验概率,并将所述后验概率作为商品信息为罗列堆砌信息的置信度。
3.如权利要求1或2所述的方法,其特征在于,所述指定特征属性包含词法特征属性或/和句法特征属性;其中,
所述词法特征属性包含以下任意一种或任意组合:
商品信息包含的逗号个数;商品信息的句长;商品信息去重后包含的词汇个数与商品信息中词汇总数的比率;商品信息中出现频率最高的词汇的出现次数;按照预设规则将商品信息划分为若干片段后,将每个片段中指定位置的词汇组成集合,针对该集合去重后的词汇个数与集合中词汇总数的比率;按照预设规则将商品信息划分为若干片段后,每个片段的方差;
所述句法特征属性包含以下任意一种或任意组合:
商品信息去重后包含的词汇的词性个数与信息标题中词汇的词性总数的比率;商品信息中为名词的词汇去重后的个数与为名词的词汇总数的比率;出现频率最高的词性的出现次数;按照预设规则将商品信息划分为若干片段后,每个片段中指定位置的词汇的词性组成的集合中,去重后的词性个数与集合中词性总数的比率。
4.如权利要求3所述的方法,其特征在于,所述按照预设规则将商品信息划分为若干片段,包括:
按照商品信息中的逗号所在位置将商品标题划分为若干片段;
或/和
按照商品信息中出现频率最高的词汇所在位置将商品标题划分为若干片段。
5.如权利要求1或2所述的方法,其特征在于,阻止发布所述商品信息后,还包括:
根据所述解析结果确定造成所述商品信息包含的词汇罗列堆砌的关键词汇;
向用户返回所述关键词汇,提示用户基于该关键词汇对商品信息进行修改。
6.如权利要求5所述的方法,其特征在于,向用户返回所述关键词汇时,向该用户通知相应的修改策略。
7.一种网站服务器,其特征在于,包括:
通信单元,用于接收用户输入的商品信息;
解析单元,用于对所述商品信息进行解析,并根据解析结果获得所述商品信息的指定特征属性的取值,所述指定特征属性用于描述商品信息所包含词汇的罗列堆砌程度;
计算单元,用于根据各指定特征属性的取值,基于最大熵原理,计算所述商品信息为罗列堆砌信息的置信度;
执行单元,用于在确定所述置信度达到设定阈值时,阻止发布所述商品信息。
8.根据权利要求7所述的网站服务器,其特征在于,所述计算单元包括:
第一计算子单元,用于将所述各指定特征属性的取值,作为基于最大熵原理的条件概率模型的给定信息;
第二计算子单元,用于采用条件概率模型计算在所述给定信息的情况下,所述商品信息为罗列堆砌信息的后验概率,并将所述后验概率作为商品信息为罗列堆砌信息的置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010187445.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于弹簧探针组装的模具
- 下一篇:节点式气网架结构